maanantai 24. maaliskuuta 2014

Viikon softavinkki - vko 13 - SubRip

Viikon 13 softavinkki on DVD:ltä tekstitykset SRT:ksi irroittava SubRip.

Joskus voi olla tar­vet­ta saa­da DVD-le­vyl­tä teks­ti­tyk­set eril­li­sek­si tie­dos­tok­si SRT-muo­toon, jo­ka on puh­das­ta teks­tiä toi­sin kuin mo­net muut teks­ti­tys­muo­dot. Näin esi­mer­kik­si jos ha­lu­taan muun­taa DVD yk­sit­täi­sek­si siir­ret­tä­väk­si tie­dos­tok­si ja sa­mal­la pa­ran­taa teks­ti­tyk­sen laa­tua, ko­koa tai kir­jai­sin­ta.

Va­li­tet­ta­vas­ti DVD:n teks­ti­tyk­set ei­vät ole tal­len­net­tu teks­ti­nä DVD:lle vaan ku­vi­na. Jos täl­lai­nen ku­va ha­lu­taan ta­kai­sin oi­keak­si teks­tik­si tar­vi­taan so­pi­va oh­jel­ma lu­ke­maan ku­vat ja tun­nis­ta­maan ku­vis­sa ole­vat kir­jai­met (teks­tin­tun­nis­tus, OCR) jon­ka jäl­keen kir­jai­met ovat ta­kai­sin puh­taa­na ja muo­kat­ta­vis­sa ole­va­na teks­ti­nä.

SubRip on il­mai­nen oh­jel­ma jo­ka suo­rit­taa teks­tin tun­nis­tuk­sen, käyt­tä­jän avus­tuk­sel­la tosin. Aluk­si Sub­Ripil­le näet täy­tyy opet­taa jo­kai­nen ensi ker­taa vas­taan tu­le­va merk­ki, erik­seen niin ta­val­liset kuin vaik­ka kur­si­voi­dut, niin isot että pienet kir­jai­met. Työ saat­taa kuu­los­taa suu­rel­ta, mut­ta sitä se ei on­nek­si ole, Sub­Rip näet op­pii ko­ko ajan työn ede­tes­sä eikä kysy enää uudes­taan jo tun­nis­ta­maan­sa kir­jain­ta. It­sel­tä­ni vie noin. 5 mi­nuut­tia DVD:n teks­ti­tyk­sen ir­roit­ta­mi­nen SRT-muo­toon.Ei täysin ongelmatonta

SubRip tun­nis­taa var­sin mainios­ti kir­jaimet mut­ta sil­lä on yksi ongel­ma jos­ta se ei tun­nu selviä­vän kunnial­la. Sub­Ripil­lä on ongel­ma tun­nis­taa pieni i ja pieni l. Se tunnis­taa ne usein väärin, eli teks­tistä tulee esim. täl­lais­ta:
Mltä olltkaan sanomassa?
(pitäisi olla Mitä olitkaan sanomassa?)
Jot­kut neuvo­vat että kun teks­tit esit­tää lopul­lises­sa videos­sa Arial-kir­jai­si­mel­la niin virhe ei niin hait­taisi, mutta mieles­täni täl­löin pitää olla jo puoli­sokea. Kyllä sen virheen vain edel­leen huomaa.

Toinen tilan­ne on jos kir­jain­ten välil­lä ei ole riittä­västi väliä. Alla ole­vasta kuvas­ta näet mi­ten alem­man rivin ä-kir­jai­men pis­teet ovat otet­tu mu­kaan tunnis­tukseen yhdes­sä ylemäl­lä rivil­lä olevan S-kir­jai­men kans­sa. Täl­löin ko. ri­vit kannat­taa kir­joit­taa itse.


Koska SRT on puh­das­ta teks­tiä, voit jäl­keen­päin kor­ja­ta vir­heet. Itse siir­rän jos­kus teks­tit Wordiin ja oiko­luvul­la kor­jaan pahim­mat mokat.


Linkkejä

Ei kommentteja: