How to fix the UTF 8 in pdf files

Hello,

I am trying to extract the government data file which is in Malayalam pdf. But it seems the text UTF in the pdf is corrupt, so even copy-paste is giving junk characters. I am attaching the pdf file. Is there any way to fix the UTF?

https://drive.google.com/file/d/19E1FU0HFKH0HRKI5VH7R_tJcStUuBsQW/view?usp=sharing

The text is ASCII. You can search for ASCII Unicode converters (like Payyans) to get it into Unicode

1 Like

https://mlconverter.icfoss.org/ เด‡เดคเดฟเดฒเต‡เด•เตเด•เต เด•เต‹เดชเตเดชเดฟ เดชเต‡เดธเตเดฑเตเดฑเต เดšเต†เดฏเตเดฏเตเด•เดฏเต‹ เดซเดฏเตฝ เด†เดฏเดฟ เด…เดชเตโ€Œเดฒเต‹เดกเต เดšเต†เดฏเตเดฏเตเด•เดฏเต‹ เดšเต†เดฏเตเดคเดพเตฝ เดฎเดคเดฟโ€ฆ

ASCII เดฏเต† เด•เตเดฑเดฟเดšเตเดšเต เด•เต‚เดŸเตเดคเตฝ เด…เดฑเดฟเดฏเดพเตป :-https://smc.org.in/articles/ascii-unicode-fonts

1 Like