How to fix the UTF 8 in pdf files

Hello,

I am trying to extract the government data file which is in Malayalam pdf. But it seems the text UTF in the pdf is corrupt, so even copy-paste is giving junk characters. I am attaching the pdf file. Is there any way to fix the UTF?

https://drive.google.com/file/d/19E1FU0HFKH0HRKI5VH7R_tJcStUuBsQW/view?usp=sharing

The text is ASCII. You can search for ASCII Unicode converters (like Payyans) to get it into Unicode

1 Like

https://mlconverter.icfoss.org/ ഇതിലേക്ക് കോപ്പി പേസ്റ്റ് ചെയ്യുകയോ ഫയൽ ആയി അപ്‌ലോഡ് ചെയ്യുകയോ ചെയ്താൽ മതി…

ASCII യെ കുറിച്ച് കൂടുതൽ അറിയാൻ :-https://smc.org.in/articles/ascii-unicode-fonts

1 Like