Kaikista DjVu tiedostoista
DjVu (lausutaan: Déjà-Vu) on erityisesti skannattujen asiakirjojen kuvien pakkausformaatti. Toisin kuin PDF, joka on optimoitu erityisesti tekstille ja vektorigrafiikalle, DJVU tallentaa pakattuja pikselikuvia. Se on ihanteellinen kirjojen, aikakauslehtien tai historiallisten asiakirjojen skannaukseen. Suurin etu on PDF-tiedostoon verrattuna erityisen pieni tiedostokoko. DjVu kehitettiin vuosina 1996–2001 AT&T Labsissa.
Miten DjVu-tiedostojen pakkaus toimii?
DjVu jakaa jokaisen sivun tasoihin: etualalle (teksti ja viivat), taustalle (paperin rakenne ja kuvat) ja maskiin. Jokainen taso pakataan omalla, tähän tehtävään optimoidulla algoritmilla:
Teksti käsitellään JB2-algoritmilla. Se tunnistaa toistuvat kuviot. Näin ollen kirjain "a" tallennetaan vain kerran, jos se esiintyy toistuvasti samassa fontissa ja samankokoisena. Jokainen tämän kirjaimen myöhempi esiintyminen tallennetaan vain viitteenä. Tämä säästää huomattavasti tallennustilaa. Taustataso käyttää IW44:ää, wavelet-pohjaista algoritmia, joka on samanlainen kuin JPEG 2000. Tuloksena DjVu-tiedostot voivat olla 5–10 kertaa pienempiä kuin vastaavanlaiset PDF-tiedostot.
DjVu:n historia ja levinneisyys
2000-luvun alussa DjVu oli vakava kilpailija PDF-tiedostoille. Million Book Project, yksi maailman suurimmista digitointiprojekteista, käytti DjVu:ta vuodesta 2002 lähtien yhtenä tulostusformaatteinaan. Myös yliopistokirjastot, Wikisource ja jotkut tieteelliset arkistot luottivat DjVu:hun. Sen suosio huipentui noin vuonna 2015, kun selaimet lopettivat tiettyjen laajennusten ja Java-sovellusten tuen. Vuonna 2016 Internet Archive ilmoitti lopulta, että se ei enää luo uusia DjVu-tiedostoja, sillä PDF oli vakiintunut standardiksi.
Huolimatta uusien DjVu-tiedostojen määrän laskusta, internetissä on edelleen miljoonia DjVu-tiedostoja. Jotta nämä tiedostot voidaan avata suoraan ja korkealaatuisina kaikilla laitteilla, on järkevää muuntaa ne PDF-muotoon. Ainoa haittapuoli on hieman suurempi tiedostokoko muuntamisen jälkeen. Nykyään hieman suurempi tiedostokoko on kuitenkin useimmiten hyväksyttävissä.
Lähteet
Archive.org: Keskustelu DjVu-tiedostojen luomisen lopettamisesta
Archive.org: Katsaus 20 vuoden Million Book Project -projektiin
Eldakar, Y., El Gammal, K., Adly, N. et al.: The Million Book Project at Bibliotheca Alexandrina. Journal of Zhejiang University-SCIENCE A 6(11), 1327–1340 (2005). https://doi.org/10.1631/jzus.2005.A1327
Muunna, avaa ja muokkaa DjVu tiedostoja
Tietoja DjVu-tiedostoista
- Ohjelmisto DjVu-tiedostojen avaamiseen
- Ohjelmisto DjVu-tiedostojen muokkaamiseen
- MIME-tyyppi DjVu: lle
Ei kommentteja