{"id":209,"date":"2024-02-03T11:38:18","date_gmt":"2024-02-03T09:38:18","guid":{"rendered":"http:\/\/www.kimmogranqvist.fi\/?page_id=209"},"modified":"2024-02-06T11:01:38","modified_gmt":"2024-02-06T09:01:38","slug":"romtwol-koesivu","status":"publish","type":"page","link":"http:\/\/www.kimmogranqvist.fi\/index.php\/romtwol-koesivu\/","title":{"rendered":"ROMTWOL"},"content":{"rendered":"\n<p>ROMTWOL on Suomen romanikielen automaattinen morfologinen analysaattori, joka hy\u00f6dynt\u00e4\u00e4 Kimmo Koskenniemen 1980-luvulla kehitt\u00e4m\u00e4\u00e4 kaksitasomallia (Koskenniemi 1983). Se on s\u00e4\u00e4nt\u00f6pohjaisen kieliteknologian malli, joka perustuu \u00e4\u00e4rellisiin transduktoreihin eli \u00e4\u00e4rellistilaisiin automaatteihin (Finite-State Transducers, FST), jotka muuntavat merkkijonoja toisiksi merkkijonoiksi. Kaksitasomallin p\u00e4\u00e4komponentit ovat leksikko ja s\u00e4\u00e4nn\u00f6st\u00f6.<\/p>\n\n\n\n<p class=\"has-medium-pink-color has-light-blue-background-color has-text-color has-background has-link-color has-medium-font-size wp-elements-43fec7e4ee6f7a5bc4a4a0704d26ca9e\"><strong>Kokeile t\u00e4st\u00e4 ROMTWOLia:<br><\/strong><a href=\"https:\/\/www.kielipankki.fi\/cgi-bin\/romtwol.py\"><strong>https:\/\/www.kielipankki.fi\/cgi-bin\/romtwol.py<\/strong><\/a>.<\/p>\n\n\n\n<p>Nykyist\u00e4 Suomen romanikielen automaattista morfologista analysaattoria edelsi vuosina 2001&#8211;2002 kehitetty kokeellisluonteinen, kaksitasomallia hy\u00f6dynt\u00e4v\u00e4 Suomen romanikielen kielioppimalli ROMTWOL (Granqvist 2005). Se toimi PC-KIMMO-ohjelmistolla MS-DOS:ssa. Sen leksikko k\u00e4sitti vain suuret sanaluokat (substantiivit, adjektiivit, verbit, yhteens\u00e4 1721 \u201dsana-artikkelia\u201d), mutta siin\u00e4 oli kattava s\u00e4\u00e4nn\u00f6st\u00f6. Vanha ROMTWOL ei kuitenkaan en\u00e4\u00e4 ole yhteensopiva nykyisten k\u00e4ytt\u00f6j\u00e4rjestelmien eik\u00e4 modernien luonnollisen kielen k\u00e4sittelyyn tarkoitettujen ohjelmistojen kanssa. Se ei my\u00f6sk\u00e4\u00e4n tukenut Suomen romanikielen standardiortografiaa.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"382\" height=\"535\" src=\"http:\/\/www.kimmogranqvist.fi\/wp-content\/uploads\/2024\/02\/romtwol_2024-02-06_24.54_05.png\" alt=\"\" class=\"wp-image-285\" srcset=\"http:\/\/www.kimmogranqvist.fi\/wp-content\/uploads\/2024\/02\/romtwol_2024-02-06_24.54_05.png 382w, http:\/\/www.kimmogranqvist.fi\/wp-content\/uploads\/2024\/02\/romtwol_2024-02-06_24.54_05-214x300.png 214w\" sizes=\"auto, (max-width: 382px) 100vw, 382px\" \/><figcaption class=\"wp-element-caption\">Vanhan ROMTWOLin leksikkoa.<\/figcaption><\/figure>\n\n\n\n<p>ROMTWOLin uusi versio 2 on rakennettu ja kirjoitettu kokonaan uudelleen nykyisten ohjelmistojen (HFST-LEXC ja HFST-TWOLC) formalismien mukaiseksi, ja sen kielimalli on uudistettu kattamaan Suomen romanikielen koko tunnetun perussanaston ja koko s\u00e4\u00e4nt\u00f6per\u00e4isen kieliopin (Granqvist 2007, 2011) kuvausten ja romanikielen lautakunnan suositusten mukaiseksi. ROMTWOL 2 toimii komentorivipohjaisena sovelluksena. Sen kehitysymp\u00e4rist\u00f6n\u00e4 on Red Hat Enterprise Linux (RHEL), t\u00e4m\u00e4nhetkinen versio 9.3, mutta TWOL toimii my\u00f6s Windowsissa ja Applen j\u00e4rjestelmiss\u00e4.<\/p>\n\n\n\n<p>ROMTWOL 2 on julkaistu avoimen l\u00e4hdekoodin GNU GPL-lisenssin (General Public Lisence) alaisuudessa. GPL:n alla lisensoidusta ohjelmasta pit\u00e4\u00e4 aina olla saatavilla l\u00e4hdekoodi, ja ohjelmaa voi vapaasti k\u00e4ytt\u00e4\u00e4 mihin tahansa tarkoitukseen, muokata ja levitt\u00e4\u00e4 edelleen (my\u00f6s kaupallisesti). GPL kuitenkin vaatii, ett\u00e4 ohjelmaa ja siihen perustuvia muita ohjelmia levitet\u00e4\u00e4n GPL:n alaisuudessa.<br>Nykyisen ROMTWOLin ortografia noudattaa romanikielen ortografiakomitean suositusta (1971). TWOLissa leksikon teht\u00e4v\u00e4n\u00e4 kuvata kielen morfotaksi \u2013 se, miten ja miss\u00e4 j\u00e4rjestyksess\u00e4 p\u00e4\u00e4tteet voivat liitty\u00e4 sanavartaloihin ja toisiinsa. Lis\u00e4ksi leksikossa luetellaan kielen sanavartalot, johtimet ja p\u00e4\u00e4tteet<\/p>\n\n\n\n<p>ROMTWOLin version 2 leksikko perustuu vanhan ROMTWOLin sanastoon, johon on lis\u00e4tty pronominit, determinoijat, numeraalit, johtamattomat adverbit, adpositiot, rinnastus- ja alistuskonjunktiot, partikkelit ja prefiksej\u00e4. Substantiivien taivutustyyppej\u00e4 kuvataan leksikossa yhteens\u00e4 15 ja adjektiivien 4. Verbien taivutustyypit perustuvat konsonantti- vs. vokaalivartaloisuuteen sek\u00e4 preteritin muodostustapoihin, joita on Suomen romanikielen s\u00e4\u00e4nt\u00f6per\u00e4isess\u00e4 verbimorfologiassa kaikkiaan 5. Leksikkoon on lis\u00e4tty runsaasti ep\u00e4produktiivisia johdoksia, mik\u00e4 on tarpeen, koska kieliopissa kuvataan vain s\u00e4\u00e4nt\u00f6per\u00e4isin\u00e4 pidett\u00e4vin\u00e4 muotoja (vrt. Granqvist 2007). T\u00e4ll\u00e4 hetkell\u00e4 leksikon koko on 3996 entry\u00e4, eli leksikko on yli kaksinkertaistunut verrattuna vanhaan ROMTWOLiin. Leksikon laajentaminen julkaistuista sanastol\u00e4hteist\u00e4 on k\u00e4ynniss\u00e4. TWOLin s\u00e4\u00e4nt\u00f6komponentissa kuvataan aakkosto ja kielen morfofonologiset s\u00e4\u00e4nn\u00f6t. ROMTWOLin s\u00e4\u00e4nt\u00f6komponentti on kirjoitettu kokonaan uudelleen TWOLC-formalismin mukaiseksi.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"306\" src=\"http:\/\/www.kimmogranqvist.fi\/wp-content\/uploads\/2024\/02\/kieliteknologiaa_2024-02-06_1.04_07-1024x306.png\" alt=\"\" class=\"wp-image-288\" srcset=\"http:\/\/www.kimmogranqvist.fi\/wp-content\/uploads\/2024\/02\/kieliteknologiaa_2024-02-06_1.04_07-1024x306.png 1024w, http:\/\/www.kimmogranqvist.fi\/wp-content\/uploads\/2024\/02\/kieliteknologiaa_2024-02-06_1.04_07-300x90.png 300w, http:\/\/www.kimmogranqvist.fi\/wp-content\/uploads\/2024\/02\/kieliteknologiaa_2024-02-06_1.04_07-768x230.png 768w, http:\/\/www.kimmogranqvist.fi\/wp-content\/uploads\/2024\/02\/kieliteknologiaa_2024-02-06_1.04_07.png 1497w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\">ROMTWOLin kokeilua.<\/figcaption><\/figure>\n\n\n\n<p>ROMTWOL kykenee t\u00e4ll\u00e4 hetkell\u00e4 tunnistamaan keskim\u00e4\u00e4rin yli 90 % juoksevien tekstien sanoista. ROMTWOLia on testattu yliopistoon tarkoitetun Suomen romanikielen oppikirjan Vaaguno! (Granqvist 2011) lukukappaleiden 1\u20137 teksteill\u00e4, jotka on kirjoitettu melko kurinalaisesti. ROMTWOL kykenee taivuttamaan kaikissa muodoissa periaatteessa oppi- ja sanakirjoissa dokumentoidut romanikielen sanat. Vaagunon! tekstej\u00e4 k\u00e4ytettiin kokeilussa, koska ne ovat l\u00e4hell\u00e4 romanikielen kodifioitua kirjakielt\u00e4. Tulokset vertautuvat hyvin muidenkin pohjoismaisten \u201dpienten\u201d kielten automaattisten muoto-opin j\u00e4sentimien saavuttamiin (Nordic ad hoc workgroup on the status of smaller languages in the Nordic countries, tulossa).<\/p>\n\n\n\n<p>ROMTWOL-ty\u00f6skentely\u00e4  ovat rahoittaneet vuonna 2023 Suomen Kulttuurirahasto ja Fuugin s\u00e4\u00e4ti\u00f6. <\/p>\n","protected":false},"excerpt":{"rendered":"<p>ROMTWOL on Suomen romanikielen automaattinen morfologinen analysaattori, joka hy\u00f6dynt\u00e4\u00e4 Kimmo Koskenniemen 1980-luvulla kehitt\u00e4m\u00e4\u00e4 kaksitasomallia (Koskenniemi 1983). Se on s\u00e4\u00e4nt\u00f6pohjaisen kieliteknologian malli, joka perustuu \u00e4\u00e4rellisiin transduktoreihin eli \u00e4\u00e4rellistilaisiin automaatteihin (Finite-State Transducers, FST), jotka muuntavat merkkijonoja toisiksi merkkijonoiksi. Kaksitasomallin p\u00e4\u00e4komponentit ovat leksikko ja s\u00e4\u00e4nn\u00f6st\u00f6. Kokeile t\u00e4st\u00e4 ROMTWOLia:https:\/\/www.kielipankki.fi\/cgi-bin\/romtwol.py. Nykyist\u00e4 Suomen romanikielen automaattista morfologista analysaattoria edelsi vuosina 2001&#8211;2002 kehitetty &hellip; <a href=\"http:\/\/www.kimmogranqvist.fi\/index.php\/romtwol-koesivu\/\" class=\"more-link\">Continue reading <span class=\"screen-reader-text\">ROMTWOL<\/span><\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"footnotes":""},"class_list":["post-209","page","type-page","status-publish","hentry"],"_links":{"self":[{"href":"http:\/\/www.kimmogranqvist.fi\/index.php\/wp-json\/wp\/v2\/pages\/209","targetHints":{"allow":["GET"]}}],"collection":[{"href":"http:\/\/www.kimmogranqvist.fi\/index.php\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"http:\/\/www.kimmogranqvist.fi\/index.php\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"http:\/\/www.kimmogranqvist.fi\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"http:\/\/www.kimmogranqvist.fi\/index.php\/wp-json\/wp\/v2\/comments?post=209"}],"version-history":[{"count":11,"href":"http:\/\/www.kimmogranqvist.fi\/index.php\/wp-json\/wp\/v2\/pages\/209\/revisions"}],"predecessor-version":[{"id":339,"href":"http:\/\/www.kimmogranqvist.fi\/index.php\/wp-json\/wp\/v2\/pages\/209\/revisions\/339"}],"wp:attachment":[{"href":"http:\/\/www.kimmogranqvist.fi\/index.php\/wp-json\/wp\/v2\/media?parent=209"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}