Ero sivun ”Tiedostomuoto” versioiden välillä
[katsottu versio] | [katsottu versio] |
Rivi 44: | Rivi 44: | ||
=== Ohjelmatiedostomuodot === |
=== Ohjelmatiedostomuodot === |
||
Ohjelmatiedostomuotoja käytetään |
Ohjelmatiedostomuotoja käytetään [[konekieli]]sten ohjelmien tiedoille sekä [[objektitiedosto]]ille. |
||
* [[Executable and Linkable Format]] (ELF) |
* [[Executable and Linkable Format]] (ELF) |
Versio 14. heinäkuuta 2018 kello 15.12
Tiedostomuoto ilmaisee tietokoneiden tallennusmedialle talletetun tiedoston tallennusmuodon eli rakenteen. Monista tiedostomuodoista on olemassa julkinen määritelmä, jossa kuvataan miten tieto tulee koodata. Hyötynä on talletetun tiedon yhteensopivuus eri ohjelmien ja järjestelmien välillä.
Tiedostomuodon merkintä ja tunnistus
Tiedostomuodon tunnistamiseen on kehitetty useita eri tapoja. Unix ja Unixin kaltaiset käyttöjärjestelmät tunnistavat tiedostomuodon sen alussa olevasta merkkisarjasta. Esimerkiksi GIF-kuvatiedostot alkavat ASCII-merkeillä GIF87a
tai GIF89a
standardista riippuen ja käännetty Java-koodi heksaluvuilla 0xCAFEBABE[1]. Amiga OS tunnistaa tiedostot samalla menetelmällä ja esimerkiksi IFF -tiedostot alkavat merkkijonolla FORM
. Neljän merkin "Type ID" tunnistetta kutsutaan eri yhteyksissä eri tavoin: Mac OS-alustalla Type ID-koodia kutsutaan OSType:ksi ja Windows-alustalla FourCC:ksi. Uudempi macOS noudattaa BSD:n tavoin Unix-tapaa. Tiedostomuoto voidaan tällöin tunnistaa sen nimeämisestä riippumatta ja esimerkiksi komentoriviputken tai verkon yli välitetyn datavirran yhteydessä tiedostomuoto tunnistetaan ilman nimeä.
Eräs käytetty tapa on käyttää tiedostopäätteitä. Eräät tiedostonhallintaohjelmat kuten Windowsin Explorer tai KDE:n tiedostoselain Konqueror käyttävät tiedostopäätettä päätelläkseen tiedoston tiedostotyypin. Tiedostopääte on tiedoston nimessä viimeisen pisteen jälkeen tulevat merkit. Esimerkiksi HTML-dokumentit tunnistetaan .html
-tiedostopäätteestä. Muita tiedostomuodon tunnistamiseen käytettäviä tapoja on muun muassa tiedostomuodon päättely tiedoston sisällön perusteella ja metadatan tallentaminen tiedostojärjestelmään.
Tiedostopäätteet näkyvät tiedostonimen loppuosassa pisteellä eroteltuna. Esimerkiksi tiedostonimessä foobar.txt
, pääteosa .txt
voi ilmaista tiedoston olevan yksinkertainen muotoilematon tekstitiedosto, jonka voi avata millä tahansa tekstitiedostoja lukevalla tekstieditorilla tai tekstinkäsittelyohjelmalla.
Eräs tapa ilmaista tiedostomuoto on MIME-tyypit. Ne ovat hallitseva tapa kuvata tiedostomuotoja Internetissä. MIME-muodot koostuvat standardoiduista tunnisteista, jossa tyyppi ja alatyyppi erotetaan vinoviivalla: esimerkiksi text/html
tai image/gif
. MIME-tyypit oli tarkoitettu alun perin kuvaamaan sähköpostin liitetiedostojen tiedostomuotoja alustariippumattomasti. Sama tekniikka on otettu WWW:n HTTP-tiedostosiirtoprotokollan käyttöön.
Tekniikka
Tiedostomuoto tarkoittaa välttämättöminen valinnaisten tietojen säilömistä rakenteeseen, joka voidaan ohjelmallisesti käsitellä yhdessä tai useammassa eri ohjelmassa. Välttämättömiä tietoja voivat olla audiokanavien lukumäärä ja näytteenottotaajuus äänen oikean toiston varmistamiseksi. Valinnaisia tietoja voivat olla tekijän ja tiedoston luomiseen käytetyn ohjelman nimi sekä ajan hetki.
Esimerkiksi AIFF-tiedostomuoto koostuu lohkoista, joissa kerrotaan tietynlaisia metatietoja itse audiodatasta. Metatiedot kertovat montako bittiä yksittäinen ääninäyte on ja ohjelma sen mukaan voi jakaa datan eri kanaviin.[2] Käsittelevä ohjelma voi myös ohittaa lohkot joita se ei välttämättä tarvitse sillä hetkellä.
Säännönmukainen tiedostomuoto voi olla olennaista, jotta tietoa voidaan käsitellä luotettavasti eri ohjelmaversioiden ja eri ohjelmien välillä, osittain koska uudemmat versiot voivat lisätä tietoa jota aiemmat versiot eivät osaa käsitellä.
Tiedostomuotoja
Tiedostomuotoja on olemassa useita eri tarkoituksiin. Joihinkin tarkoituksiin on jopa useita kilpailevia muotoja. Osa tiedostomuodoista on suunniteltu vain yhtä tarkoitusta varten, kuten JPEG staattisten kuvien tallennusta varten. Osaa tiedostomuodoista voidaan käyttää useaan tarkoitukseen, kuten GIF-tiedostomuoto jota voidaan käyttää kuvien ja animaatioiden tallentamiseen. Tiedostomuodot voidaan jakaa käyttötarkoituksensa perusteella seuraavasti:
Arkistotiedostomuodot
Arkistotiedostomuodot tiivistävät alkuperäisiä tiedostoja ja arkistoimalla säästetään muistitilaa tai pystytään siirtämään tiedostoja verkostossa vähäisemmällä määrällä tietoliikennettä.
Unixeissa käytetty tar-ohjelma ei itsessään pakkaa, mutta tukee ulkoisia pakkausohjelmia kuten gzip, bzip2 ja xz pakkaamiseen ja purkamiseen.
Kuvatiedostomuodot
Kuvatiedostomuotoja käytetään kuvien tallentamiseen, säilyttämiseen ja katseluun. Kuvat voidaan jakaa bittisyvyytensä mukaan määrittyviin värisyvyyksiin.
- BMP, kehittäjä Microsoft Windows bitmap, pakkaamaton tiedostomuoto
- GIF, kehittäjä/patentin haltija Unisys/IBM
- JPEG, kehittäjä Joint Photographic Experts Group [1]
- PNG, vapaa W3C-standardi, uusi versio ISO/IEC 15948:2003
- RAW-tiedostomuodot ovat digitaalikameroiden muokkaamattomien raakakuvien tiedostomuotoja, mitkä digitaalikamera tallentaa sellaisenaan käsittelemättöminä.
- SVG, Vektorigrafiikan tiedostomuoto
- TIFF, Sivuntaitto-ohjelmien tiedostomuoto
Ohjelmatiedostomuodot
Ohjelmatiedostomuotoja käytetään konekielisten ohjelmien tiedoille sekä objektitiedostoille.
- Executable and Linkable Format (ELF)
- EXE
- MZ
- Portable Executable (PE)
- PY, kehittäjä Python, käytetään Python-koodien pyörittämiseen.
Tekstitiedostomuodot
Tekstitiedostomuodot, mitä käytetään tekstien tallentamiseen ja esittämiseen yksinkertaisimmasta ja varhaisimmasta monipuolisimpaan lueteltuna.
- TXT, tekstimerkkitiedosto
- RTF, rikastettu tekstimerkkitiedosto
- DOC, Microsoft Wordin tiedostomuoto, käytetään myös monissa muissa tekstinkäsittelyohjelmissa
Videotiedostot
Yleisimmät videotiedostot ovat säiliömuotoja, jotka eivät pakota mitään tiettyä koodekkia videolle tai äänelle vaan voivat sisältää eri tavalla koodattua dataa.
Äänitiedostomuodot
- WAV, Microsoftin tiedostomuoto, yleensä häviötön pakkaus
- FLAC, vapaa standardi, häviötön pakkaus
- MP3, häviöllinen pakkaus
- Ogg, vapaa standardi, Häviöllinen pakkaus
- AAC, häviöllinen pakkaus
- MIDI, soitinäänet tallentava tiedostomuoto
Katso myös
Lähteet
- ↑ JSR-000202 JavaTM Class File Specification Update Evaluation 1.0 Final Release
- ↑ Audio Interchange File Format (AIFF) muratnkonar.com. Viitattu 28.11.2017.
Aiheesta muualla
- FILExt – The File Extension Source (englanniksi)
- Wotsit (englanniksi)
- File extensions (englanniksi)
- http://www.fileinfo.net (englanniksi)
- Magic signature database – Standard file format information and FFID registry
- Format wars File formats for websites and print explained
- File signatures (aka magic numbers) found in files to indicate their file type
- PRONOM technical registry
- Library of Congress file format information
- Intoduction to Uniform Type Identifiers
- Game File Format Central – A large and expanding list of detailed descriptions of game-related file-formats
- BIEW Binary vIEW project