Od dłuższego czasu pracuję nad generatorem synonimów języka polskiego. Sprawa nie jest prosta, bo nasz język to mnóstwo form gramatycznych, związków frazeologicznych, czy też takich samych słów o całkiem innym znaczeniu – w różnych formach gramatycznych np. miał, mam, lata, śmieci – tak zwane homonimy.
Stworzenie idealnego generatora synonimów działającego w miarę szybko jest prawdopodobnie niemożliwe. Jednak można stworzyć generator, który da na wyjściu tekst, który można skorygować w bardzo krótkim czasie – niemal przelatując wzrokiem po wygenerowanym tekście.
Oto efekt w postaci powyższego tekstu przed ręczną korektą już po wymieszaniu (tekst wejściowy 603 znaki, tekst wyjściowy z synonimami 2661):
Od wielu tygodni pracuję nad generatorem synonimów ozora naszego. Rafa nie jest prosta, ponieważ lokalny język to bezdno postaci gramatycznych, związków frazeologicznych, oznacza to takich samych słów o całkowicie drugim znaczeniu – w niejednolitych postaciach gramatycznych np. miał, mam, lata, śmieci – jak najbardziej zwane homonimy.
Stworzenie nieposzlakowanego generatora bliskoznaczników działającego w dawkę szybko jest prawdopodobnie przykre. Przecież wolno utworzyć generator, który da na wyjściu artykuł, który wolno skorygować w bardzo krótkim czasie – raczej przelatując wzrokiem po uformowanym artykule.
Oto efekt w postaci 2 tekstów po ręcznej korekcie i po wymieszaniu (czas korygowania: 1 minuta 55 sekund, tekst wyjściowy z synonimami 2298 znaków):
Przez długi czas pracuję nad generatorem synonimów języka naszego. Zagwozdka nie jest prosta, skoro nasz język to multum form gramatycznych, związków frazeologicznych, to znaczy takich samych słów o realnie pozostałym znaczeniu – w niejednolitych postaciach gramatycznych np. miał, mam, lata, śmieci – tak właśnie zwane homonimy.
Stworzenie nienagannego generatora synonimów funkcjonującego w miarę szybko jest prawdopodobnie trudne. Wszak da się uskutecznić generator, który da na końcu artykuł, który da się skorygować w najniezwyklej krótkim okresie – nieznacznie przelatując wzrokiem po wygenerowanym tekście.
Drugi przykład:
Sporo czasu pracuję nad generatorem bliskoznaczników języka krajowego. Kwestia nie jest prosta, albowiem nasz język to wiele form gramatycznych, związków frazeologicznych, czy też takich samych słów o absolutnie innym znaczeniu – w odrębnych postaciach gramatycznych np. miał, mam, lata, śmieci – oczywiście zwane homonimy.
Stworzenie idealnego generatora synonimów funkcjonującego w miarę szybko jest prawdopodobnie uciążliwe. Natomiast wolno sporządzić generator, który da na końcu tekst, który wolno skorygować w bardziej krótkim czasie – prawie przelatując wzrokiem po wytworzonym wpisie.
Teskty z synonimami:
{Od dłuższego czasu|Sporo czasu|Przez długi czas|Od wielu wielu dni|Od wielu tygodni} pracuję {nad} {generatorem} {synonimów|bliskoznaczników|jednoznaczników} {języka} {polskiego|krajowego|lokalnego|naszego|własnego}. {Sprawa|Komplikacja|Przeciwność|Przeszkoda|Trudność|Zagwozdka|Zgryzota|Kwestia} nie jest {prosta|łatwa}, {bo|albowiem|bowiem|gdyż|ponieważ|skoro} {nasz|krajowy|lokalny|polski|własny} {język} to {mnóstwo|mrowie|multum|wiele|bezdno} {form|postaci} gramatycznych, {związków} frazeologicznych, {innymi słowy|oznacza to|to znaczy|czy też} takich {samych} słów o {całkiem|całkowicie|detalicznie|dogłębnie|dokładnie|dokumentnie|gruntownie|szczegółowiej|wnikliwie|zupełnie|absolutnie|kompletnie|totalnie|zgoła|sumarycznie|rzeczywiście|realnie|prawdziwie|szczerze|wiernie|dosłownie} {innym|drugim|pozostałym} {znaczeniu} – w {różnych|innych|niepodobnych|odmiennych|bogatych|przeróżnych|rozlicznych|rozmaitych|różnorodnych|wielorakich|odrębnych|heterogenicznych|niejednolitych|niejednorodnych} {formach|postaciach} gramatycznych np. miał, mam, lata, śmieci – {naturalnie|oczywiście|tak|istotnie|jak najbardziej|rzecz jasna|w rzeczy samej|w samej rzeczy|zaiste|a jakże|naturalnie|tak właśnie} {zwane} homonimy.
{Stworzenie} {idealnego|doskonałego|nienagannego|nieposzlakowanego|nieskazitelnego|perfekcyjnego|wybitnego} {generatora} {synonimów|bliskoznaczników|jednoznaczników} {działającego|funkcjonującego} w {miarę} {prędko|szybko} jest {prawdopodobnie|przypuszczalnie} {niemożliwe|ciężkie|dokuczliwe|dotkliwe|męczące|nieznośne|trudne|uciążliwe}. {Jednak|Ale|Jednakże|Lecz|Natomiast|Przecież|Tymczasem|Wszak|Chociaż|Choć|Wprawdzie} {jest dozwolone|można|wolno|da się} {stworzyć|skonstruować|sporządzić|utworzyć|zmajstrować|dokonać|wykonać|zrealizować} {generator}, który da na {wyjściu|końcu} {tekst|wpis|artykuł}, który {jest dozwolone|można|wolno|da się} skorygować w {bardzo|nader|nadzwyczaj|niesłychanie|niezmiernie|ogromnie|wielce|wybitnie} {krótkim} {czasie|okresie} – {niemal|poniekąd|raczej|względnie|skromnie|lekko|nieznacznie|częściowo|niby|niejako|nieomal|prawie|właściwie|prędzej} przelatując {wzrokiem} po {wygenerowanym|uformowanym|wytworzonym} {tekście|wpisie|artykule}.
Podsumowanie
Generator jest mocno zaawansowany, do wygenerowania powyższego tekstu (przypomnę 603 znaki) potrzebne było odpytać bazę synonimów prawie 700 razy! Sama baza, aby mogła dawać poprawne wyniki zawiera miliony rekordów!
Bezpośredni tekst wyjściowy z generatora może zawierać kilka błędów – jednak znośnych i na zapleczowe strony takie teksty będą się nadawały (patrz tekst wygenerowany bez korekty). Użytkownik będzie musiał poświęcić chwilkę na sprawdzenie wygenerowanego tekstu, aby otrzymać bezbłędnie generowane teksty.
Wciąż pracuję jeszcze nad generatorem by pracy przy korekcie było jeszcze mniej. Aby jednak tak było muszę generować mnóstwo tekstów i sprawdzać ich poprawność – bo wiele rzeczy wychodzi dopiero w praniu 🙂
Narzędzie do generowania synonimów będzie dostępne online! Kiedy? Chciałbym jak najszybciej – ale muszę jeszcze trochę potestować wyniki i wyeliminować jeszcze niepasujące słowa z synonimów.
Wygląda świetnie. Pytanie brzmi czy jest jednak sens się w to bawić i czy google rzeczywiście nie ma desynomizera
Człowiek zawsze rozpozna synonim z automatu – ale powodzenia w pracy nad tym tematem – na pewno bym korzystał
Marzeniem jest tekst, który nie zostanie rozpoznany jako pochodzący z synonimów. Trzeba by wybierać pomiędzy jakością a ilością synonimów. W sumie nie byłoby to trudne do zrobienia.
Po ostatniej aktualizacji Pandy może lepiej posiedzieć i napisać nowy tekst ?
Będzie Ci bardzo ciężko zrobić tak dobry generator synonimów – powiem nawet, że język polski jest na tyle trudny, że jest to niemożliwe, ale powodzenia i szacun za chęci.