Apa itu Captcha ? Mengapa harus ngetik captcha ?

Awalnya saya gak kenal apa itu captcha, waktu ngisi form-form online kayak daftar email, daftar ikutan , saya mikir “Ngapain harus ngetik tulisan bengkok dan nggak jelas/ kabur lagi ! Kenapa nggak sekali klik langsung punya email ! Sekali klik langsung jadi member ! Buang2 waktu aja”. Buat agan yg berpikiran sama kayak gue, sebaiknya baca artikel ini : D

Apa itu Captcha ?

CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart) : sebuah tantangan-response test yg ditujukan untuk memastikan bahwa responden hanya dilakukan oleh manusia & bukan oleh komputer. Ini pernah dilakukan oleh Alan Turing di tahun 1950 dan dikenal dg sebutan metode Turing Test. Jadi dg CAPTCHA, kita dapat memastikan bahwa pengisi formulir (misal e-mail) adalah benar-benar seorang manusia, yang mana program komputer akan kesulitan dalam mengartikan huruf-huruf yg bengkok-bengkok,  bertumpuk, kabur sementara manusia (agak) mudah membacanya. Seperti ini salah satu captcha-nya,

Mengapa harus ngetik captcha ?

Saat nggak ada CAPTCHA, spammer/hacker sanggup ngebuat program yg secara otomatis ngisi formulir, seperti ndaftar email gratis, sehingga ia akan mempunyai ribuan alamat email dg mudah agar kemudian disalahgunakan. Atau ditujukan mengubah sebuah hasil akhir polling online, dg cara membuat program sederhana pengisi polling tersebut dg jawaban yg diinginkan sebanyak ribuan atau bahkan jutaan kali. Akibatnya polling itu menjadi tidak valid. Disinilah CAPTCHA sangat berperan penting untuk memastikan bukan komputer yg mengisi formulir-formulir online, melainkan seorang manusia, karena komputer tidak akan bisa membaca huruf-huruf bengkok, bertumpuk, saling menyambung.

CAPTCHA terbentuk secara otomatis secara acak tiap kali ada orang yg masuk halaman formulir web, jadi hampir nggak ada dua CAPTCHA yg serupa. Sehingga jumlah kombinasi yg muncul suangat-suangat buanyak, dan hampir nggak mungkin untuk ngebuat program yg mampu mengingat & menjawab CAPTCHA yg akan muncul. Untuk yg cacat mata juga ada CAPTCHA versi audio, dg prinsip yg kurang lebih sama.

Penggunaan CAPTCHA sekarang jauh lebih luas, nggak hanya untuk formulir web, tapi juga untuk menyelamatkan arsip-arsip penting di dunia, dg cara mengubah format arsip yg sudah ada (buku, dokumen tercetak) ke format digital (file komputer). Dua kendala utama yg muncul : banyaknya jumlah arsip yg tersimpan selama ratusan tahun, serta kualitas cetakan yg buruk sehingga hasil scan-nya sukar dikenali oleh komputer. Dengan gabungan kedua kendala itu, hampir mustahil membayar tenaga manusia untuk membaca secara manual arsip yg gagal dibaca komputer. Karena itulah muncullah re-CAPTCHA, sebuah sistem yg bekerja sama dg Google Books dan The Internet Archive, dimana hasil scan arsip yg gagal dibaca komputer dimunculkan sebagai CAPTCHA, lalu hasil isian itu dianggap sebagai teks yg hilang/tak terbaca. Agar yakin teks itu benar, biasanya tidak hanya satu jawaban yg dipakai, melainkan hingga sepuluh/ lebih jawaban yg sama.

Ini menjadi solusi win-win bagi semua pihak. Bagi pemilik web dengan formulir, ia mendapat CAPTCHA yg sudah tidak bisa dikenali oleh komputer super canggih yg dipakai untuk proses digitalisasi arsip, sehingga hacker juga kesulitan membuat program yg mampu membacanya. Dan bagi pihak pengubah format arsip, dg begitu banyaknya formulir yg diisi diseluruh dunia tiap harinya, re-CAPTCHA dapat membantu digitalisasi arsip dg cepat & gratis.

Jadi saat ngisi formulir di website yg bekerja sama dengan re-CAPTCHA, Anda sudah turut membantu menyelamatkan arsip dunia bagi anak cucu kita semua nanti. Sayangnya setelah diimplementasikan sekian tahun, sistem CAPTCHA sudah mulai menunjukkan beberapa kelemahan. Perkembangan hardware & software membuatnya tidak lagi terlalu sukar untuk dipecahkan oleh program. Apalagi kini muncul perusahaan-perusahaan atau layanan decaptcher di dunia ketiga yang bersedia memecahkan CAPTCHA dengan biaya yang sangat murah. DeCaptcher.com bersedia memecahkan CAPTCHA dengan hanya US$2 per 1000 CAPTCHA. Untuk mengatasinya, saat ini beberapa pihak seperti Universitas Carnegie Mellon dan Penn State sedang mengembangkan CAPTCHA yang berbasis gambar, bukan lagi huruf.

Penjelasan ReCaptcha menurut Google sbb,

  • reCAPTCHA adalah sebuah fasilitas internet yang membantu untuk mendigitalkan buku-buku, surat kabar maupun siaran radio lawas..berupa 'teks tedistorsi' dimana kita harus mengetik teks tersebut untuk menjalankan perintah.
  • Sebuah CAPTCHA adalah program yang dapat memberitahu apakah user adalah seorang 'manusia asli' atau 'script komputer yang sudah diprogram'.
  • CAPTCHA digunakan banyak website untuk mencegah penyalahgunaan dari "bot" atau program otomatis yang biasanya ditulis untuk menghasilkan pesan-pesan spam pada internet.
  • Tidak ada program komputer yang dapat membaca teks terdistorsi sebaik mata manusia, sehingga bot tidak akan dapat menavigasi situs yang dilindungi oleh CAPTCHA


Dari sini diketahui bahwa salah satu fungsi reCAPTCHA : untuk mendigitalisasikan buku-buku pengetahuan bersejarah yg diterbitkan sebelum adanya komputer..

Bagaimana prosesnya digitalisasinya ?
Mula-mula, buku yang ingin didigitalisasikan discan dulu menggunakan scanner..


Setelah discan, gambar yang dihasilkan diubah menjadi teks komputer menggunakan software Optical Character Recognition (OCR)..

masalahnya disini, hasil OCR belum tentu perfect..masih ada sebagian kata yang belum bisa diterjemahkan.. Naahh..saat inilah program reCAPTCHA dibutuhkan..

reCAPTCHA membantu proses digitalisasi buku dengan mengirim kata-kata yang tidak dapat dibaca oleh komputer ke Web dalam bentuk CAPTCHA untuk diuraikan sendiri oleh manusia.
Lebih jelas lagi, setiap kata yang tidak bisa dibaca dengan benar oleh OCR akan ditempatkan pada gambar dan digunakan sebagai CAPTCHA. Hal ini dimungkinkan karena sebagian besar program OCR memberitahukan Anda bila kata tidak dapat dibaca dengan benar.

Lalu jika memang teks tersebut tidak bisa terbaca, lantas bagaimana sistem CAPTCHA mengetahui bahwa teks yang diketik user pada CAPTCHA itu benar/salah?..
Caranya adalah dengan menggunakan 2 kata pada setiap captcha. Kata pertama adalah kata yang memang sudah terbaca pada OCR, sedangkan kata kedua adalah kata yang belum terbaca.

User kemudian diminta untuk mengetik kedua kata tersebut pada CAPTCHA. Jika mereka berhasil memecahkan kata pertama (yg sudah diketahui), maka sistem juga menganggap jawaban mereka adalah benar untuk kata kedua . Sistem kemudian memberikan gambar tersebut kepada orang lain untuk diselesaikan, dengan menambah jumlah kemungkinan bahwa kata kedua memang 'itu' jawabannya..dst..

Dari info diatas, kita tau mengapa harus ngetik captcha, karena itu ada beberapa perusahaan besar yg mau ngebayar kita (pake dollar rek) untuk ngetik captcha online. Silahkan diklik yg mau kerja ngetik captcha

Artikel ini diupdate tgl 09-06-2013

ARTIKEL TERKAIT :

3 komentar:

Jika Anda menginginkan respon yg cepat silahkan langsung sms/call Hp. 0852 3009 3707