Linux'ta Komut Satırını Kullanarak PDF Dosyasını Düzenlenebilir Metne Dönüştürme
Bir PDF dosyasını düzenlenebilir metne dönüştürmek istemenizin çeşitli nedenleri olabilir. Belki eski bir belgeyi gözden geçirmelisiniz ve elinizde olan tek şey, PDF versiyonudur. PDF dosyalarını Windows'ta dönüştürmek kolaydır, ancak ya Linux kullanıyorsanız?
Telaşa gerek yok. Size “poppler-utils” paketinin bir parçası olan pdftotext adlı bir komut satırı aracını kullanarak PDF dosyalarını kolayca düzenlenebilir metne nasıl dönüştürebileceğinizi göstereceğiz. Bu araç zaten kurulmuş olabilir. Sisteminizde pdftotext yüklü olup olmadığını kontrol etmek için, bir terminal penceresi açmak için “Ctrl + Alt + T” tuşlarına basın. Komut istemine aşağıdaki komutu yazın ve “Enter” tuşuna basın.
dpkg -s poppler-utils
NOT: Bu makalede bir şeyler yazdığımızda ve metnin etrafında alıntılar olduğunu söylediğimizde, aksi belirtmedikçe alıntıları YAPMAYIN..
Eğer pdftotext kurulu değilse, komut istemine aşağıdaki komutu yazın ve “Enter” tuşuna basın.
sudo apt-get install poppler-utils
İstendiğinde şifrenizi yazın ve “Enter” tuşuna basın.
Poppler-utils paketinde PDF'yi farklı biçimlere dönüştürmek, PDF dosyalarını değiştirmek ve dosyalardan bilgi çıkarmak için çeşitli araçlar bulunmaktadır..
Bir PDF dosyasını düzenlenebilir bir metin dosyasına dönüştürmek için temel komut aşağıdadır. Bir Terminal penceresi açmak için "Ctrl + Alt + T" tuşlarına basın, komut istemine komutu yazın ve "Enter" tuşuna basın.
pdftotext /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Her bir dosyanın yolunu, orijinal PDF dosyanızın konumuna ve adına ve sonuçta elde edilen metin dosyasını kaydetmek istediğiniz yere karşılık gelecek şekilde değiştirin. Ayrıca dosya adlarını dosyalarınızın adlarına karşılık gelecek şekilde değiştirin..
Metin dosyası oluşturuldu ve Linux'ta başka bir metin dosyasını açtığınız gibi açılabilir..
Dönüştürülen metinde istemediğiniz yerlerde satır kesmeleri olabilir. Satır sonları, PDF dosyasındaki her metin satırından sonra eklenir.
“-Layout” bayrağını kullanarak belgenizin düzenini (üstbilgiler, altbilgiler, sayfalama vb.) Orijinal PDF dosyasından dönüştürülen metin dosyasında koruyabilirsiniz..
pdftotext -layout /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Yalnızca bir PDF dosyasındaki bir dizi sayfayı dönüştürmek istiyorsanız, dönüştürmek istediğiniz aralıktaki ilk ve son sayfaları belirtmek için “-f” ve “-l” (küçük harfli “L”) bayraklarını kullanın..
pdftotext -f 5 -l 9 / home/lori/Documents/Sample.pdf / home/lori/Documents/Sample.txt
Sahip şifresiyle korunan ve şifrelenmiş bir PDF dosyasını dönüştürmek için, “-opw” bayrağını kullanın (bayraktaki ilk karakter sıfır değil, “O” küçük harfdir).
pdftotext -opw 'password' /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Dönüştürülmekte olan orijinal PDF dosyasını korumak için kullanılan parolayı "parola" olarak değiştirin. “Parola” etrafında iki değil tek tırnak olduğundan emin olun.
PDF dosyası bir kullanıcı şifresiyle korunuyorsa ve şifrelenmişse, “-opw” bayrağı yerine “-upw” bayrağını kullanın. Komutun geri kalanı aynı.
Dönüştürülen metne uygulanan satır sonu karakterinin türünü de belirleyebilirsiniz. Bu, özellikle Windows veya Mac gibi farklı bir işletim sistemindeki dosyaya erişmeyi planlıyorsanız yararlıdır. Bunu yapmak için “-eol” bayrağını kullanın (bayrağın ortasındaki küçük harf “O”, sıfır değil), ardından boşluk ve kullanmak istediğiniz satır sonu karakterinin türü (“ unix ”,“ dos ”veya“ mac ”).
NOT: Metin dosyası için bir dosya adı belirtmezseniz, pdftotext otomatik olarak PDF dosya adının tabanını kullanır ve “.txt” uzantısını ekler. Örneğin, “file.pdf”, “file.txt” ye dönüştürülür. Metin dosyası “-“ olarak belirtilirse, dönüştürülen metin stdout'a gönderilir; bu, metnin Terminal penceresinde görüntülendiği ve bir dosyaya kaydedilmediği anlamına gelir..
Terminal penceresini kapatmak için sol üst köşedeki “X” düğmesine tıklayın..
Pdftotext komutu hakkında daha fazla bilgi için Terminal penceresindeki komut satırına "man page pdftotext" yazın..