python

RTF to TXT: rychlá extrakce čitelného textu

Lehký utility script pro převod RTF obsahu na čistý text.

RTF to TXT: rychlá extrakce čitelného textu

Občas člověk dostane data v RTF a potřebuje z nich co nejrychleji vytáhnout čistý text. Bez formátování, bez ručního kopírování.

Tenhle script dělá přesně to: odstraní RTF syntaxi, dekóduje znaky a vrátí čitelný výstup.

Co to umí

  • odstranění RTF control wordů
  • odfiltrování technických bloků a skupin
  • převod escapovaných hex znaků
  • vrácení plain textu vhodného pro další zpracování

Kde to používám

Původně jsem tím převáděl data z SQL databáze z lékařského programu, který byl v RTF a já potřeboval jen text pro další zpracování.

Proč to stojí za zveřejnění

Je to malý, rychlý a praktický nástroj, který řeší reálný problém bez složité instalace.

Zdroj projektu