RTF to TXT: rychlá extrakce čitelného textu
Lehký utility script pro převod RTF obsahu na čistý text.
Občas člověk dostane data v RTF a potřebuje z nich co nejrychleji vytáhnout čistý text. Bez formátování, bez ručního kopírování.
Tenhle script dělá přesně to: odstraní RTF syntaxi, dekóduje znaky a vrátí čitelný výstup.
Co to umí
- odstranění RTF control wordů
- odfiltrování technických bloků a skupin
- převod escapovaných hex znaků
- vrácení plain textu vhodného pro další zpracování
Kde to používám
Původně jsem tím převáděl data z SQL databáze z lékařského programu, který byl v RTF a já potřeboval jen text pro další zpracování.
Proč to stojí za zveřejnění
Je to malý, rychlý a praktický nástroj, který řeší reálný problém bez složité instalace.
Zdroj projektu
- Odkaz na zdroj: /projects/repo-browser/?src=code/rtf-to-txt.py