Jaman sekarang ini dunia orang-orang sangat menginginkan informasi yang cepat, apapun yang dilakukan oleh manusia jaman sekarang tidak lepas dari peranan atau perantara dari informasi, dan itu semua dapat di lakukan dengan menggunakan internet, apa pun yang orang ingin lakukan pasti banyak yang menggunakan internet sebagai mentor mereka agar mendapat apa yang dicarinya, kemampuan seseorang untuk mengolah data menjadi informasi di dunia menjadi incaran banyak orang bahkan tidak sedikit dari orang-orang tersebut meraup keuntungan finansial dari hal tersebut. Dengan kebutuhan informasi yang sekian banyak maka banyak orang yang menggunakan kesempatan ini untuk membuat suatu sistem informasi untuk memudahkan manusia untuk mendapatkan informasi tersebut.
Sistem informasi tersebut disebut dengan Sistem Temu Kembali Informasi, sistem ini merupakan sistem yang berfungsi untuk menemukan informasi yang relevan dengan kebutuhan user. Salah satu hal yang perlu diingat adalah bahwa informasi yang diproses terkandung dalam sebuah dokumen yang bersifat tekstual sistem ini juga sering disebut IR ( Information Retrieval ). Dalam konteks ini, temu kembali informasi berkaitan dengan representasi, penyimpanan, dan akses terhadap dokumen representasi dokumen. Dokumen yang ditemukan tidak dapat dipastikan apakah relevan dengan kebutuhan informasi pengguna yang dinyatakan dalam query. Pengguna Sistem Temu Kembali informasi sangat bervariasi dengan kebutuhan informasi yang berbeda-beda. Sistem temu kembali ini juga termasuk dalam sistem informasi.
Sejarah Sistem Temu Kembali Informasi
Berikut adalah sejarah dari pada sistem temu kembali dari tahun ke tahun.
1960-70-an:
– Eksplorasi awal dari sistem text retrieval untuk corpora abstrak ilmiah “kecil”, dan dokumen hukum dan bisnis.
– Pengembangan model retrieval dasar Boolean dan ruang vektor.
– Prof. Salton dan mahasiswanya di Cornell University mengawali penelitian di bidang ini.
1980-an:
– Sistem database dokumen besar, banyak dijalankan oleh perusahaan:
• LexisNexis – arsip yang dapat dicari (searchable)
dari content surat kabar, majalah, dokumen legal (hukum) dan sumber tercetak lain.
• Dialog
• MEDLINE
1990-an:
– Pencarian dokumen FTPable di Internet
• Archie
• WAIS (Wide Area Information System)
– Pencarian World Wide Web
• Lycos
• Yahoo
• Altavista
1990-an (lanjutan):
– Kompetisi Terorganisir
• NIST(National Institute of Standards and
Technology) TREC(Text REtrieval Conference) dimulai tahun 1992
– Sistem rekomendasi
• Ringo (musik)
• Amazon (buku)
• NetPerceptions (collaborative filtering)
– Katagorisasi dan clustering teks otomatis
2000-an
– Analisis link untuk pencarian web
• Google
– Ekstraksi informasi otomatis
• Whizbang
• Fetch
• Burning Glass
– Jawaban pertanyaan
• TREC Q/A track
2000-an (lanjutan):
– IR Multimedia
• Image
• Audio dan musik
• Video
– IR lintas-bahasa
• DARPA TIDES(Translingual Information Detection, Extraction and Summarization)
– Perangkuman dokumen
Tujuan dan Fungsi Sistem Temu Kembali Informasi
Sistem Temu Kembali Informasi didisain untuk menemukan dokumen atau informasi yang diperlukan oleh masyarakat pengguna. Sistem Temu Kembali Informasi bertujuan untuk menjembatani kebutuhan informasi pengguna dengan sumber informasi yang tersedia dalam situasi seperti dikemukakan oleh Belkin (1980) sebagai berikut:
1. Penulis mempresentasikan sekumpulan ide dalam sebuah dokumen menggunakan sekumpulan konsep.
2. Terdapat beberapa pengguna yang memerlukan ide yang dikemukakan oleh penulis tersebut, tapi mereka tidak dapat mengidentifikasikan dan menemukannya dengan baik.
3. Sistem temu kembali informasi bertujuan untuk mempertemukan ide yang dikemukakan oleh penulis dalam dokumen dengan kebutuhan informasi pengguna yang dinyatakan dalam bentuk pertanyaan (query).
Berkaitan dengan sumber informasi di satu sisi dan kebutuhan informasi pengguna di sisi yang lain, Sistem Temu Kembali Informasi berperan untuk:
1. Menganalisis isi sumber informasi dan pertanyaan pengguna.
2. Mempertemukan pertanyaan pengguna dengan sumber informasi untuk mendapatkan dokumen yang relevan.
Adapun fungsi utama Sistem Temu Kembali Informasi seperti dikemukakan oleh Lancaster (1979) dan Kent (1971) adalah sebagai berikut:
1. Mengidentifikasi sumber informasi yang relevan dengan minat masyarakat pengguna yang ditargetkan.
2. Menganalisis isi sumber informasi (dokumen)
3. Merepresentasikan isi sumber informasi dengan cara tertentu yang memungkinkan untuk dipertemukan dengan pertanyaan (query) pengguna.
4. Merepresentasikan pertanyaan (query) pengguna dengan cara tertentu yang memungkinkan untuk dipertemukan sumber informasi yang terdapat dalam basis data.
5. Mempertemukan pernyataan pencarian dengan data yang tersimpan dalam basis data.
6. Menemu-kembalikan informasi yang relevan.
7. Menyempurnakan unjuk kerja sistem berdasarkan umpan balik yang diberikan oleh pengguna.
Komponen Sistem Temu Kembali Informasi
Menurut Lancaster (1979) Sistem Temu Kembali Informasi terdiri dari 6 (enam) subsistem, yaitu:
1. Subsistem dokumen
2. Subsistem pengindeksan
3. Subsistem kosa kata
4. Subsistem pencarian
5. Subsistem antarmuka pengguna-sistem
6. Subsistem penyesuaian.
Dokumen sebagai objek data dalam Sistem Temu Kembali Informasi merupakan sumber informasi. Dokumen biasanya dinyatakan dalam bentuk indeks atau kata kunci. Kata kunci dapat diekstrak secara langsung dari teks dokumen atau ditentukan secara khusus oleh spesialis subjek dalam proses pengindeksan yang pada dasarnya terdiri dari proses analisis dan representasi dokumen. Pengindeksan dilakukan dengan menggunakan sistem pengindeksan tertentu, yaitu himpunan kosa kata yang dapat dijadikan sebagai bahasa indeks sehingga diperoleh informasi yang terorganisasi. Sementara itu, pencarian diawali dengan adanya kebutuhan informasi pengguna. Dalam hal ini Sistem Temu Kembali Informasi berfungsi untuk menganalisis pertanyaan (query) pengguna yang merupakan representasi dari kebutuhan informasi untuk mendapatkan pernyataan-pernyataan pencarian yang tepat. Selanjutnya pernyataan-pernyataan pencarian tersebut dipertemukan dengan informasi yang telah terorganisasi dengan suatu fungsi penyesuaian (matching function) tertentu sehingga ditemukan dokumen atau sekumpulan dokumen.
Kebutuhan IR
Kebutuhan dari pada IR ini terlihat dari pemilik WWW: lebih 25 milyar halaman web, 1.3 milyar gambar dan lebih 1 milyar pesan Usenet yang diindeks pada Google (2006). Selain itu juga ada faktor lain yang menyangkut b erbagai kebutuhan informasi:
– Mencari dokumen yang masuk dalam topik tertentu
– Mencari suatu informasi spesifik
– Mencari jawaban dari suatu pertanyaan
– Mencari informasi dalam bahasa berbeda
Ini lah yang membuat pencarian halaman WWW adalah hal yang sangat trend sekarang ini.
Contoh Sistem IR
Berikut adalah contoh-contoh dari pada sistem temu kembali atau sering disebut sistem IR.
• Conventional (katalog perpustakaan)
Pencarian dengan kata kunci, judul, penulis, dll.
• Text-based (Google, Yahoo, ASK).
Pencarian dengan kata kunci (keyword). Pencarian
terbatas menggunakan query dalam bahasa alami.
• Multimedia (QBIC, WebSeek, SaFe)
Pencarian dengan penampilan visual (bentuk, warna,…)
• Sistem jawaban pertanyaan (AskJeeves, Answerbus)
Pencarian dalam bahasa alami (terbatas)
• Lainnya:
IR lintas-bahasa, music retrieval
Skema gambar user yang menggunakan sistem temu kembali.
Cara Cerdas Menggunakan Sistem Temu Kembali
Sistem IR ini sangatlah berguna maka perlu yang namanya keahlian agar bisa menggunakan sistem ini dengan baik, berikut diantaranya.
• Memanfaatkan pengertian atau makna dari kata
yang digunakan.
• Melibatkan urutan kata di dalam query.
• Beradaptasi dengan pengguna berdasarkan
pada feedback, langsung atau tidak langsung.
• Memperluas pencarian dengan term terkait.
• Mengerjakan pemeriksaan ejaaan/perbaikan
tanda pengenal otomatis.
• Memanfaatkan Otoritas dari sumber informasi.
Social Plugin