Sekilas Pengertian Tentang Format File

Sekilas Pengertian Tentang Format File – Format file sering kali memiliki spesifikasi yang diterbitkan yang menjelaskan metode pengkodean dan memungkinkan pengujian fungsionalitas yang dimaksudkan program. Tidak semua format memiliki dokumen spesifikasi yang tersedia secara bebas, sebagian karena beberapa pengembang melihat dokumen spesifikasi mereka sebagai rahasia dagang , dan sebagian karena pengembang lain tidak pernah membuat dokumen spesifikasi formal, membiarkan preseden ditetapkan oleh program lain yang sudah ada yang menggunakan format menentukan format melalui bagaimana program yang ada ini menggunakannya.

Sekilas Pengertian Tentang Format File

proofreadmyfile.com – Jika pengembang format tidak mempublikasikan spesifikasi gratis, pengembang lain yang ingin menggunakan jenis file tersebut harus merekayasa balik file tersebut untuk mengetahui cara membacanya atau memperoleh dokumen spesifikasi dari pengembang format dengan biaya dan dengan menandatangani perjanjian non-disclosure . Pendekatan terakhir hanya mungkin jika dokumen spesifikasi formal ada. Kedua strategi tersebut membutuhkan waktu, uang, atau keduanya yang signifikan; oleh karena itu, format file dengan spesifikasi yang tersedia untuk umum cenderung didukung oleh lebih banyak program.

Paten

Hukum paten , daripada hak cipta , lebih sering digunakan untuk melindungi format file. Meskipun paten untuk format file tidak secara langsung diizinkan menurut undang-undang AS, beberapa format menyandikan data menggunakan algoritme yang dipatenkan . Misalnya, menggunakan kompresi dengan format file GIF memerlukan penggunaan algoritme yang dipatenkan, dan meskipun pemilik paten awalnya tidak memberlakukan paten mereka, mereka kemudian mulai mengumpulkan biaya royalti . Hal ini mengakibatkan penurunan yang signifikan dalam penggunaan GIF, dan sebagian bertanggung jawab untuk pengembangan format PNG alternatif . Namun, paten GIF berakhir di AS pada pertengahan 2003, dan di seluruh dunia pada pertengahan 2004.

Baca Juga : Apakah Yang Dimaksud Mengedit Dokumen?

Mengidentifikasi jenis file

Sistem operasi yang berbeda secara tradisional mengambil pendekatan yang berbeda untuk menentukan format file tertentu, dengan masing-masing pendekatan memiliki kelebihan dan kekurangannya sendiri. Sebagian besar sistem operasi modern dan aplikasi individual perlu menggunakan semua pendekatan berikut untuk membaca format file “asing”, jika tidak berfungsi sepenuhnya.

Ekstensi nama file

Salah satu metode populer yang digunakan oleh banyak sistem operasi, termasuk Windows , macOS , CP/M , DOS , VMS dan VM/CMS adalah menentukan format file berdasarkan akhir namanya, lebih khusus lagi huruf-huruf setelah titik akhir. Bagian dari nama file ini dikenal sebagai ekstensi nama file . Misalnya, dokumen HTML diidentifikasi dengan nama yang diakhiri dengan .html (atau .htm ), dan gambar GIF dengan .gif . Dalam sistem file FAT asli , nama file terbatas pada pengenal delapan karakter dan ekstensi tiga karakter, yang dikenal sebagai nama file 8.3 . Hanya ada begitu banyak ekstensi tiga huruf, jadi, seringkali ekstensi yang diberikan mungkin ditautkan ke lebih dari satu program. Banyak format masih menggunakan ekstensi tiga karakter meskipun sistem operasi dan program aplikasi modern tidak lagi memiliki batasan ini. Karena tidak ada daftar ekstensi standar, lebih dari satu format dapat menggunakan ekstensi yang sama, yang dapat membingungkan sistem operasi dan pengguna.

Salah satu artefak dari pendekatan ini adalah bahwa sistem dapat dengan mudah ditipu untuk memperlakukan file sebagai format yang berbeda hanya dengan mengganti namanya— file HTML dapat, misalnya, dengan mudah diperlakukan sebagai teks biasa dengan mengganti namanya dari nama file.html menjadi nama file . txt . Meskipun strategi ini berguna bagi pengguna ahli yang dapat dengan mudah memahami dan memanipulasi informasi ini, sering kali membingungkan bagi pengguna yang kurang teknis, yang dapat secara tidak sengaja membuat file tidak dapat digunakan (atau “kehilangan”) dengan mengganti namanya secara tidak benar.

Hal ini menyebabkan sebagian besar versi Windows dan Mac OS menyembunyikan ekstensi saat membuat daftar file. Ini mencegah pengguna mengubah jenis file secara tidak sengaja, dan memungkinkan pengguna ahli untuk menonaktifkan fitur ini dan menampilkan ekstensi.

Menyembunyikan ekstensi, bagaimanapun, dapat membuat tampilan dua atau lebih nama file identik dalam folder yang sama. Misalnya, logo perusahaan mungkin diperlukan dalam format .eps (untuk penerbitan) dan format .png (untuk situs web). Dengan ekstensi yang terlihat, ini akan muncul sebagai nama file unik: ” CompanyLogo.eps ” dan ” CompanyLogo.png “. Di sisi lain, menyembunyikan ekstensi akan membuat keduanya muncul sebagai ” Logo Perusahaan “, yang dapat menyebabkan kebingungan.

Menyembunyikan ekstensi juga dapat menimbulkan risiko keamanan. Misalnya, pengguna jahat dapat membuat program yang dapat dijalankan dengan nama yang tidak bersalah seperti ” Holiday photo.jpg.exe “. ” .exe ” akan disembunyikan dan pengguna yang tidak curiga akan melihat ” Foto liburan.jpg “, yang akan tampak seperti gambar JPEG , biasanya tidak dapat merusak mesin. Namun, sistem operasi masih akan melihat file ” .exe” ekstensi dan jalankan program, yang kemudian dapat menyebabkan kerusakan pada komputer. Hal yang sama berlaku untuk file dengan hanya satu ekstensi: karena tidak ditampilkan kepada pengguna, tidak ada informasi tentang file yang dapat disimpulkan tanpa menyelidiki secara eksplisit Untuk mengelabui pengguna lebih lanjut, dimungkinkan untuk menyimpan ikon di dalam program, dalam hal ini beberapa penetapan ikon sistem operasi untuk file yang dapat dieksekusi ( .exe ) akan diganti dengan ikon yang biasa digunakan untuk mewakili gambar JPEG, membuat program terlihat seperti gambar. Ekstensi juga dapat dipalsukan: beberapa virus makro Microsoft Word membuat file Word dalam format template dan menyimpannya dengan .docperpanjangan. Karena Word umumnya mengabaikan ekstensi dan melihat format file, ini akan terbuka sebagai templat, menjalankan, dan menyebarkan virus.  Ini menunjukkan masalah praktis untuk sistem Windows di mana penyembunyian ekstensi diaktifkan secara default.

Metadata internal

Cara kedua untuk mengidentifikasi format file adalah dengan menggunakan informasi mengenai format yang disimpan di dalam file itu sendiri, baik informasi yang dimaksudkan untuk tujuan ini atau string biner yang kebetulan selalu berada di lokasi tertentu dalam file dari beberapa format. Karena tempat termudah untuk menemukannya adalah di awal, area seperti itu biasanya disebut header file jika lebih besar dari beberapa byte , atau angka ajaib jika panjangnya hanya beberapa byte.

Judul file

Metadata yang terkandung dalam header file biasanya disimpan di awal file, tetapi mungkin juga ada di area lain, sering kali termasuk di akhir, tergantung pada format file atau tipe data yang ada. File berbasis karakter (teks) biasanya memiliki header berbasis karakter, sedangkan format biner biasanya memiliki header biner, meskipun ini bukan aturan. Header file berbasis teks biasanya memakan lebih banyak ruang, tetapi karena dapat dibaca manusia, mereka dapat dengan mudah diperiksa dengan menggunakan perangkat lunak sederhana seperti editor teks atau editor heksadesimal.

Selain mengidentifikasi format file, header file mungkin berisi metadata tentang file dan isinya. Misalnya, sebagian besar file gambar menyimpan informasi tentang format gambar, ukuran, resolusi, dan ruang warna , dan informasi authoring opsional seperti siapa yang membuat gambar, kapan dan di mana gambar itu dibuat, model kamera dan pengaturan fotografi apa yang digunakan ( Exif ), dan segera. Metadata tersebut dapat digunakan oleh perangkat lunak yang membaca atau menafsirkan file selama proses pemuatan dan setelahnya.

Header file dapat digunakan oleh sistem operasi untuk mengumpulkan informasi tentang file dengan cepat tanpa memuat semuanya ke dalam memori, tetapi melakukannya menggunakan lebih banyak sumber daya komputer daripada membaca langsung dari informasi direktori . Misalnya, ketika manajer file grafis harus menampilkan isi folder, ia harus membaca header banyak file sebelum dapat menampilkan ikon yang sesuai, tetapi ini akan ditempatkan di tempat yang berbeda pada media penyimpanan sehingga membutuhkan waktu lebih lama untuk mengakses . Folder yang berisi banyak file dengan metadata kompleks seperti informasi thumbnail mungkin memerlukan waktu yang cukup lama sebelum dapat ditampilkan.

Jika tajuk adalah kode keras biner sehingga tajuk itu sendiri memerlukan interpretasi yang kompleks agar dapat dikenali, terutama demi perlindungan konten metadata, ada risiko bahwa format file dapat disalahartikan. Bahkan mungkin telah ditulis dengan buruk pada sumbernya. Ini dapat mengakibatkan metadata rusak yang, dalam kasus yang sangat buruk, bahkan dapat membuat file tidak dapat dibaca

Angka ajaib

Salah satu cara untuk memasukkan metadata jenis file, yang sering dikaitkan dengan Unix dan turunannya, adalah dengan hanya menyimpan “angka ajaib” di dalam file itu sendiri. Awalnya, istilah ini digunakan untuk kumpulan pengidentifikasi 2-byte tertentu di awal file, tetapi karena urutan biner apa pun dapat dianggap sebagai angka, fitur format file apa pun yang membedakannya secara unik dapat digunakan untuk identifikasi. Gambar GIF , misalnya, selalu dimulai dengan representasi ASCII dari GIF87a atau GIF89a , tergantung pada standar yang mereka patuhi. Banyak jenis file, terutama file teks biasa, lebih sulit dikenali dengan metode ini. File HTML, misalnya, mungkin dimulai dengan string <html>(yang tidak peka huruf besar/kecil), atau definisi jenis dokumen yang sesuai yang dimulai dengan <!DOCTYPE HTML> , atau, untuk XHTML , pengidentifikasi XML , yang dimulai dengan <?xml . File juga dapat dimulai dengan komentar HTML, teks acak, atau beberapa baris kosong, tetapi masih berupa HTML yang dapat digunakan.

Pendekatan angka ajaib menawarkan jaminan yang lebih baik bahwa format akan diidentifikasi dengan benar, dan seringkali dapat menentukan informasi yang lebih tepat tentang file. Karena tes “angka ajaib” yang cukup andal dapat cukup kompleks, dan setiap file harus diuji secara efektif terhadap setiap kemungkinan dalam database ajaib, pendekatan ini relatif tidak efisien, terutama untuk menampilkan daftar file yang besar (sebaliknya, nama file dan metadata- metode berbasis hanya perlu memeriksa satu bagian data, dan mencocokkannya dengan indeks yang diurutkan). Selain itu, data harus dibaca dari file itu sendiri, meningkatkan latensi dibandingkan dengan metadata yang disimpan dalam direktori. Jika jenis file tidak dapat dikenali dengan cara ini, sistem harus kembali ke metadata. Namun, cara terbaik bagi sebuah program untuk memeriksa apakah file yang telah diperintahkan untuk diproses memiliki format yang benar: sementara nama file atau metadata dapat diubah secara independen dari isinya, gagal dalam tes angka ajaib yang dirancang dengan baik adalah tanda yang cukup pasti bahwa file tersebut rusak atau jenisnya salah. Di sisi lain, nomor ajaib yang valid tidak menjamin bahwa file tersebut tidak rusak atau jenisnya benar.

Apa yang disebut garis shebang dalam file skrip adalah kasus khusus angka ajaib. Di sini, angka ajaib adalah teks yang dapat dibaca manusia yang mengidentifikasi juru bahasa perintah tertentu dan opsi untuk diteruskan ke juru bahasa perintah.

Sistem operasi lain yang menggunakan angka ajaib adalah AmigaOS , di mana angka ajaib disebut “Kuki Ajaib” dan diadopsi sebagai sistem standar untuk mengenali file yang dapat dieksekusi dalam format file yang dapat dieksekusi Hunk dan juga untuk membiarkan program, alat, dan utilitas tunggal menangani file data yang disimpan secara otomatis. , atau jenis file lainnya saat menyimpan dan memuat data. Sistem ini kemudian ditingkatkan dengan sistem pengenalan Tipe Data standar Amiga . Metode lain adalah metode FourCC , yang berasal dari OSType di Macintosh, kemudian diadaptasi oleh Interchange File Format (IFF) dan turunannya

Metadata eksternal

Cara terakhir untuk menyimpan format file adalah secara eksplisit menyimpan informasi tentang format dalam sistem file, bukan di dalam file itu sendiri.

Pendekatan ini membuat metadata terpisah dari data utama dan nama, tetapi juga kurang portabel daripada ekstensi nama file atau “angka ajaib”, karena formatnya harus dikonversi dari sistem file ke sistem file. Meskipun hal ini juga berlaku untuk ekstensi nama file—misalnya, untuk kompatibilitas dengan batas tiga karakter MS-DOS —kebanyakan bentuk penyimpanan memiliki definisi yang kira-kira setara dengan data dan nama file, tetapi mungkin memiliki representasi yang bervariasi atau tidak sama sekali. metadata lebih lanjut.

Perhatikan bahwa file zip atau file arsip memecahkan masalah penanganan metadata. Program utilitas mengumpulkan beberapa file bersama dengan metadata tentang setiap file dan folder/direktori asalnya semua dalam satu file baru (misalnya file zip dengan ekstensi .zip ). File baru juga dikompresi dan mungkin dienkripsi, tetapi sekarang dapat ditransmisikan sebagai file tunggal di seluruh sistem operasi oleh sistem FTP atau dilampirkan ke email. Di tempat tujuan, itu harus dibuka ritsletingnya oleh utilitas yang kompatibel agar berguna, tetapi masalah transmisi diselesaikan dengan cara ini.