Tesseract.js, tarayıcılara görüntü OCR çevirisi getiriyor

OCR çevirisi hala mükemmel değil, ancak son birkaç yılda önemli ölçüde gelişti. Yolun başında Tesseract var çeviri motoru şu anda açık kaynaklı C++.

Bu inanılmaz bir kütüphane olmasına rağmen, yazılımla sınırlı. Neyse ki birisi Tesseract portu olan ve JavaScript'i içine Tesseract.js denilen bir liman yaptı. O 60 dile kadar destekler ve kesinlikle mükemmel olmasa da işi iyi yapıyor.

Kurulum ve kurulum yapabileceğiniz bir esinti herhangi bir resim öğesini hedefleyin Sayfada ve çalıştırın Tesseract.recognize () işlevi. Bu herhangi bir görüntü türünü alabilir ve otomatik olarak sıkıştır ve çevir tarayıcıda.

Daha karmaşık hale gelebilirsin ama güzelliği OCR'ı tek bir kod satırı ile nasıl çalıştırabilirsiniz.

Canlı bir demo görmek istiyorsanız Tesseract.js açılış sayfasına bakın. Bu, tam olarak yapabileceğiniz tarayıcıda çalışır. otomatik bir OCR çevirisi elde etmek için herhangi bir taranmış metin görüntüsünü sürükleyip bırakın.

Bu örneği GitHub sayfasından yerel olarak da indirebilir veya Tesseract.js betiğini doğrudan CDN'den ekleyerek kendi uygulamanızı oluşturabilirsiniz.

En basit kod örneği aşağıdaki gibi görünüyor benim resmim HTML resim öğesine doğrudan bir referanstır:

 Tesseract.recognize (myImage) .then (function (result) console.log (result));

Her iki şekilde de bu kütüphane web üzerinde OCR ile hareket etmek için çok yararlıdır. Mükemmel olmaktan uzak ama aynı zamanda sayfa içi dinamik OCR işlevselliği isteyen web geliştiricileri için en iyi kaynak.

Daha fazla bilgi edinmek için canlı bir demoyu izleyebileceğiniz ve çevrimiçi belgelere göz atabileceğiniz Tesseract.js GitHub sayfasını ziyaret edin..