BELAJAR ANALISIS DAN BAHASA PEMROGRAMAN

Image to Text Menggunakan Tesseract Python

Halo guys, semoga tetap sehat semua ya.
Pada post kali ini akan coba membahas terkait dengan OCR(Optical character Recognition) untuk convert gambar menjadi text. Perkenalkan Tesseract OCR yang merupakan salah satu open source Optical Character Recognition (OCR) engine gratis.

Tesseract adalah mesin pengenal karakter optik gratis. Tesseract pada awalnya dikembangkan sebagai perangkat lunak berpemilik di Hewlett-Packard antara tahun 1985 hingga 1995. Setelah sepuluh tahun tanpa perkembangan apapun yang terjadi, Hewlett Packard dan UNLV merilis Tesseract sebagai sumber terbuka pada tahun 2005. Tesseract saat ini sedang dikembangkan oleh Google dan dirilis di bawah Lisensi Apache, Version 2.0. Tesseract dianggap salah satu perangkat lunak mesin OCR bebas yang paling akurat yang tersedia saat ini.(Wikipedia.com)

Google menggunakan tesseract untuk deteksi teks di perangkat seluler, di video, dan di deteksi spam gambar Gmail. Di python sudah ada librarynya bernama 'pytesseract' yang akan kita gunakan.
Kita dapat mengekstrak informasi pada gambar resolusi tinggi dengan metode ini. Untuk gambar Blur, Noisy dan colorful kita perlu mengikuti beberapa langkah pengolahan gambar seperti membuat gambar menjadi hitam putih, menghilangkan noise salt dan pepper menggunakan lowpass filter seperti averaging filter atau Gaussian Filter, kita juga bisa membuat gambar blur dipertajam dengan menggunakan Highpass filter seperti filter Sobel. Operasi Pemrosesan Gambar ini juga dapat diterapkan oleh library OpenCV dengan python.

Langsung aja kita coba ya, ini saya coba running di google collabs kalian bisa download source codenya DISINI
Pertama kita coba hubungkan dulu google colabs dengan gdrive

Setelah itu coba masuk ke direktori kerja ya, sebenarnya bisa langsung run codenya tanpa harus masuk ke direktori.
Kemudian install library tesseract
Kemudian selanjutnya import library pytesseract . Nanti library image digunakan untuk memanggil image yang akan di convert.
Selanjutnya kita akan mengconvert image ke string atau text. Disini kita bisa menggunakan fungsi image_to_string() yang ada di pytesseract untuk mengkonvert image dan fungsi open di library image digunakan untuk memanggil gambar “quote.jpg”. Ini image yang akan kita convert.

Berikut hasil outputnya, setelah di print di dapatkan output yang hampir mirip kurang sedikit tulisan di paling bawah yaitu KHA
Jika tidak menghubungkan dengan gdrive, kalian bisa langsung upload image menggunakan perintah dibawah ini.  
Selanjutnya tinggal kita running saja code seperti sebelumnya tinggal menyesuaikan nama imagenya saja.

Kita juga bisa menggunakan opencv, kemudian setelah itu baru kita convert imagenya. 
Jika menggunakan opencv tentu kita perlu import librarynya terlebih dahulu.
Setelah itu kita coba read imagenya dan coba di show ya
Selanjutnya kita coba ubah ke bentuk gray scale
Disini kita bisa atur tresholdnya ya bisa kalian sesuaikan nantinya
Setelah ini kita coba convert dari image menjadi text seperti dibawah ini
Mungkin sekian dulu untuk post kali ini thank you
Image to Text Menggunakan Tesseract Python Image to Text Menggunakan Tesseract Python Reviewed by Jimmy Pujoseno on September 08, 2020 Rating: 5

No comments:

Recent Post

Powered by Blogger.