Ero sivun ”Tiedostomuoto” versioiden välillä

Wikipediasta
Siirry navigaatioon Siirry hakuun
[katsottu versio][katsottu versio]
Poistettu sisältö Lisätty sisältö
Ipr1 (keskustelu | muokkaukset)
mpeg on organisaatio, jolla on useita koodekkeja ja muotoja -> viitataan yhteen jotenkin järkevään tässä yhteydessä
Ipr1 (keskustelu | muokkaukset)
Rivi 65: Rivi 65:


* [[tekstitiedosto]], (toisinaan lyhennetty TXT), useita merkistöstä riippuvia muotoja
* [[tekstitiedosto]], (toisinaan lyhennetty TXT), useita merkistöstä riippuvia muotoja
* [[Rich Text Format]], rikastettu tekstimerkkitiedosto
* [[Rich Text Format]], "rikastettu" tekstitiedosto
* [[DOC (tiedostomuoto)|DOC]], useita samaa nimeä käyttäviä tiedostomuotoja, mukaanlukien [[Microsoft Word]]in käyttämä tiedostomuoto
* [[DOC (tiedostomuoto)|DOC]], useita samaa nimeä käyttäviä tiedostomuotoja, mukaanlukien [[Microsoft Word]]in käyttämä tiedostomuoto
* [[PostScript]], sivunkuvauskieli ja dokumenttimuoto
* [[PostScript]], sivunkuvauskieli ja dokumenttimuoto

Versio 4. huhtikuuta 2022 kello 01.35

Hakemisto, jonka sisällä on tiedostoja.

Tiedostomuoto tai tiedostoformaatti ilmaisee tietokoneiden tallennusmedialle, esimerkiksi kiintolevylle talletetun tiedoston tallennusmuodon eli rakenteen. Monista tiedostomuodoista on olemassa julkinen määritelmä, jossa kuvataan miten tieto tulee koodata. Hyötynä on talletetun tiedon yhteensopivuus eri ohjelmien ja järjestelmien välillä sekä tallennustilan säästö.

Tiedostomuodon merkintä ja tunnistus

Tiedostomuodon tunnistamiseen on kehitetty useita eri tapoja. Unix ja Unixin kaltaiset käyttöjärjestelmät tunnistavat tiedostomuodon sen alussa olevasta merkkisarjasta. Esimerkiksi GIF-kuvatiedostot alkavat ASCII-merkeillä GIF87a tai GIF89a standardista riippuen ja käännetty Java-koodi heksaluvuilla 0xCAFEBABE[1]. Amiga OS tunnistaa tiedostot samalla menetelmällä ja esimerkiksi IFF -tiedostot alkavat merkkijonolla FORM. Neljän merkin "Type ID" tunnistetta kutsutaan eri yhteyksissä eri tavoin: Mac OS-alustalla Type ID-koodia kutsutaan OSType:ksi ja Windows-alustalla FourCC:ksi. Uudempi macOS noudattaa BSD:n tavoin Unix-tapaa. Tiedostomuoto voidaan tällöin tunnistaa sen nimeämisestä riippumatta ja esimerkiksi komentoriviputken tai verkon yli välitetyn datavirran yhteydessä tiedostomuoto tunnistetaan ilman nimeä.

Eräs käytetty tapa on käyttää tiedostopäätteitä. Eräät tiedostonhallintaohjelmat kuten Windowsin Explorer tai KDE:n tiedostoselain Konqueror käyttävät tiedostopäätettä päätelläkseen tiedoston tiedostotyypin. Tiedostopääte on tiedoston nimessä viimeisen pisteen jälkeen tulevat merkit. Esimerkiksi HTML-dokumentit tunnistetaan .html-tiedostopäätteestä. Muita tiedostomuodon tunnistamiseen käytettäviä tapoja on muun muassa tiedostomuodon päättely tiedoston sisällön perusteella ja metadatan tallentaminen tiedostojärjestelmään.

Tiedostopäätteet näkyvät tiedostonimen loppuosassa pisteellä eroteltuna. Esimerkiksi tiedostonimessä foobar.txt, pääteosa .txt voi ilmaista tiedoston olevan yksinkertainen muotoilematon tekstitiedosto, jonka voi avata millä tahansa tekstitiedostoja lukevalla tekstieditorilla tai tekstinkäsittelyohjelmalla.

Eräs tapa ilmaista tiedostomuoto on MIME-tyypit. Ne ovat hallitseva tapa kuvata tiedostomuotoja Internetissä. MIME-muodot koostuvat standardoiduista tunnisteista, jossa tyyppi ja alatyyppi erotetaan vinoviivalla: esimerkiksi text/html tai image/gif. MIME-tyypit oli tarkoitettu alun perin kuvaamaan sähköpostin liitetiedostojen tiedostomuotoja alustariippumattomasti. Sama tekniikka on otettu WWW:n HTTP-tiedostosiirtoprotokollan käyttöön.

Tekniikka

Tiedostomuoto tarkoittaa välttämättömien valinnaisten tietojen säilömistä rakenteeseen, joka voidaan ohjelmallisesti käsitellä yhdessä tai useammassa eri ohjelmassa. Välttämättömiä tietoja voivat olla audiokanavien lukumäärä ja näytteenottotaajuus äänen oikean toiston varmistamiseksi. Valinnaisia tietoja voivat olla tekijän ja tiedoston luomiseen käytetyn ohjelman nimi sekä ajan hetki.

Esimerkiksi AIFF-tiedostomuoto koostuu lohkoista, joissa kerrotaan tietynlaisia metatietoja itse audiodatasta. Metatiedot kertovat montako bittiä yksittäinen ääninäyte on ja ohjelma sen mukaan voi jakaa datan eri kanaviin.[2] Käsittelevä ohjelma voi myös ohittaa lohkot joita se ei välttämättä tarvitse sillä hetkellä.

Säännönmukainen tiedostomuoto voi olla olennaista, jotta tietoa voidaan käsitellä luotettavasti eri ohjelmaversioiden ja eri ohjelmien välillä, osittain koska uudemmat versiot voivat lisätä tietoa jota aiemmat versiot eivät osaa käsitellä.

Tiedostomuotoja

Tiedostomuotoja on olemassa useita eri tarkoituksiin. Joihinkin tarkoituksiin on jopa useita kilpailevia muotoja. Osa tiedostomuodoista on suunniteltu vain yhtä tarkoitusta varten, kuten JPEG staattisten kuvien tallennusta varten. Osaa tiedostomuodoista voidaan käyttää useaan tarkoitukseen, kuten GIF-tiedostomuoto jota voidaan käyttää kuvien ja animaatioiden tallentamiseen. Tiedostomuodot voidaan jakaa käyttötarkoituksensa perusteella seuraavasti:

Arkistotiedostomuodot

Arkistotiedostomuodot tiivistävät alkuperäisiä tiedostoja ja arkistoimalla säästetään muistitilaa tai pystytään siirtämään tiedostoja verkostossa vähäisemmällä määrällä tietoliikennettä.

Unixeissa käytetty tar-ohjelma ei itsessään pakkaa, mutta tukee ulkoisia pakkausohjelmia kuten gzip, bzip2 ja xz pakkaamiseen ja purkamiseen.

Pakettitiedostomuodot

Ohjelmien asennukseen käytettävät pakettitiedostomuodot kuten:

Kuvatiedostomuodot

Kuvatiedostomuotoja käytetään kuvien tallentamiseen, säilyttämiseen ja katseluun. Kuvat voidaan jakaa bittisyvyytensä mukaan määrittyviin värisyvyyksiin.

  • BMP, kehittäjä Microsoft Windows bitmap, pakkaamaton tiedostomuoto
  • GIF, kehittäjä/patentin haltija Unisys/IBM
  • JPEG, kehittäjä Joint Photographic Experts Group [1]
  • PNG, vapaa W3C-standardi, uusi versio ISO/IEC 15948:2003
  • RAW-tiedostomuodot ovat digitaalikameroiden muokkaamattomien raakakuvien tiedostomuotoja, mitkä digitaalikamera tallentaa sellaisenaan käsittelemättöminä.
  • SVG, Vektorigrafiikan tiedostomuoto
  • TIFF, Sivuntaitto-ohjelmien tiedostomuoto

Ohjelmatiedostomuodot

Pääartikkeli: Ohjelmatiedosto

Ohjelmatiedostomuotoja käytetään konekielisten ohjelmien tiedoille sekä objektitiedostoille.

Teksti- ja dokumenttitiedostomuodot

Tekstitiedostomuotoja käytetään tekstien tallentamiseen ja esittämiseen. Dokumenttitiedostot voivat sisältää myös kuvia ja grafiikkaa sekä muotoilumäärittelyjä.

  • tekstitiedosto, (toisinaan lyhennetty TXT), useita merkistöstä riippuvia muotoja
  • Rich Text Format, "rikastettu" tekstitiedosto
  • DOC, useita samaa nimeä käyttäviä tiedostomuotoja, mukaanlukien Microsoft Wordin käyttämä tiedostomuoto
  • PostScript, sivunkuvauskieli ja dokumenttimuoto
  • PDF, Adoben dokumenttimuoto
  • EPUB, sähkökirjoissa käytetty muoto

Videotiedostot

Yleisimmät videotiedostot ovat säiliömuotoja, jotka eivät pakota mitään tiettyä koodekkia videolle tai äänelle vaan voivat sisältää eri tavalla koodattua dataa.

Äänitiedostomuodot

wav-muotoinen äänitallenne. 2.1 Megatavua
ogg-formaatissa oleva äänitallenne: 154 kilotavua.
  • WAV, Microsoftin tiedostomuoto, yleensä häviötön pakkaus
  • FLAC, vapaa standardi, häviötön pakkaus
  • MP3, häviöllinen pakkaus
  • Ogg, vapaa standardi, Häviöllinen pakkaus
  • AAC, häviöllinen pakkaus
  • MIDI, soitinäänet tallentava tiedostomuoto

Katso myös

Lähteet

  1. JSR-000202 JavaTM Class File Specification Update Evaluation 1.0 Final Release
  2. Audio Interchange File Format (AIFF) muratnkonar.com. Viitattu 28.11.2017.

Aiheesta muualla