Hello,
I am trying to extract the government data file which is in Malayalam pdf. But it seems the text UTF in the pdf is corrupt, so even copy-paste is giving junk characters. I am attaching the pdf file. Is there any way to fix the UTF?
https://drive.google.com/file/d/19E1FU0HFKH0HRKI5VH7R_tJcStUuBsQW/view?usp=sharing
The text is ASCII. You can search for ASCII Unicode converters (like Payyans) to get it into Unicode
https://mlconverter.icfoss.org/ เดเดคเดฟเดฒเตเดเตเดเต เดเตเดชเตเดชเดฟ เดชเตเดธเตเดฑเตเดฑเต เดเตเดฏเตเดฏเตเดเดฏเต เดซเดฏเตฝ เดเดฏเดฟ เด เดชเตโเดฒเตเดกเต เดเตเดฏเตเดฏเตเดเดฏเต เดเตเดฏเตเดคเดพเตฝ เดฎเดคเดฟโฆ
ASCII เดฏเต เดเตเดฑเดฟเดเตเดเต เดเตเดเตเดคเตฝ เด เดฑเดฟเดฏเดพเตป :-https://smc.org.in/articles/ascii-unicode-fonts