Result filters

Metadata provider

Language

  • Icelandic

Resource type

Availability

Active filters:

  • Language: Icelandic
Loading...
104 record(s) found

Search results

  • TTS Document Reader (22.10)

    ENGLISH: This project contains a web application where users can upload a text document for reading by a TTS system. To set up this application you need a connection to a TTS service, the communication with the service is implemented in a way that matches the TTS service interface as implemented by the LT program. The application is written in Ruby-on-Rails. ÍSLENSKA: Þessi hugbúnaðarpakki inniheldur vefviðmótið Skjalalestur. Notendur geta hlaðið upp textaskjölum og fengið .mp3-skrá til baka þar sem skjalið hefur verið lesið af talgervli. Til þess að setja upp viðmótið þarf að hafa aðgang að talgervilsþjónustu. Ef nota á hugbúnaðinn óbreyttan þarf talgervilsþjónustan að hafa sömu forritunarskil (API) og talgervilsþjónustan sem þróuð var innan íslensku máltækniáætlunarinnar.
  • Icelandic Homograph Classifier (24.04.)

    IceHoC is a binary classifier for Icelandic homographs following the pattern V-ll-(V|$) where the 'll' can be pronounced either /tl/ or /l/. The classifier was trained on the Labeled Corpus of Icelandic Homographs (http://hdl.handle.net/20.500.12537/327). Please refer to the projects README for further discussions and guidelines for usage. IceHoC er tól sem flokkar íslensk samstafa orð sem fylgja mynstrinu V-ll-(V|$), eða sérhljóð-ll-sérhljóð_eða_lok_orðs. Í þessum orðum er 'll' borið fram ýmist /tl/ eða /l/, eftir merkingu orðsins. IceHoC var þjálfað á málheild íslenskra samstafa orða (http://hdl.handle.net/20.500.12537/327). Fyrir nánari umfjöllun og leiðbeiningar um notkun, sjá README.
  • Icelandic TTS for Android (24.04.)

    The Símarómur application provides an Icelandic TTS application for the Android TTS service. The application provides access to one on-device voice. The app is developed with the needs of the visually impaired in mind, i.e. the voice is lightweight and very fast. Furthermore, Símarómur includes a user dictionary that allows users to define their pronunciation of words and abbreviations. Símarómur er Android app sem gerir notendum kleift að nota íslenskan talgervil í símunum, t.d. sem skjálesara. Ein rödd er í appinu, en appið er sérstaklega miðað að þörfum blindra og sjónskertra, þ.e. röddin er "létt" og mjög hröð. Einnig inniheldur Símarómur orðabók þar sem notendur geta skilgreint eigin framburð á orðum og skammstöfunum.
  • ABLTagger (PoS) - 2.0.0

    A Part-of-Speech (PoS) tagger for Icelandic. In this submission, you will find ABLTagger v2.0.0. This is a PoS tagger that works with the revised tagset and achieves an accuracy of 96.95% on MIM-Gold (cross-validation). For additional details, error analysis and categorization of this tagger and other taggers (including a previous version of ABLTagger), see I4 report for M4 (2021) in Language Technology Programme for Icelandic 2019-2023. For installation, usage, and other instructions see https://github.com/cadia-lvl/POS/releases/tag/m4 You should also check if a newer version is out (see README.md - versions) on CLARIN: - Model files - Docker image, version 2.0.0 ------------------------------------------------------------------------------------------- Markari fyrir íslensku. Í þessum pakka er ABLTagger v2.0.0. Þetta er markari sem virkar fyrir nýja markamengið og nær 96,95% nákvæmni á MÍM-Gull (krossprófanir). Fyrir nánari upplýsingar, villugreiningu og villuflokkun fyrir þennan markara og aðra (ásamt fyrri útgáfu af þessum markara), sjá I4 skýrslu fyrir vörðu 4 (2021) í Máltækniáætlun fyrir íslensku 2019-2023. Fyrir uppsetningar-, notenda- og aðrar leiðbeiningar sjá https://github.com/cadia-lvl/POS/releases/tag/m4 Einnig er gott að athuga þar hvort ný útgáfa sé komin út (sjá README.md - versions) Á CLARIN: - Líkan - Docker mynd, útgáfa 2.0.0
  • Icelandic TTS for Android (22.10)

    ENGLISH: The Símarómur application provides an Icelandic TTS application for the Android TTS service. The application provides access to voices over network of the Tiro TTS API and on-device voices that are bundled via assets. The app offers connections to most of the voices that have been developed within the LT program at this time. The voices themselves and the TTS service were developed at Reykjavik University and at Tiro ehf. (see e.g. http://hdl.handle.net/20.500.12537/268) ÍSLENSKA: Símarómur er Android app sem gerir notendum kleift að nota íslenskan talgervil í símunum, t.d. sem skjálesara. Símarómur býður upp á tengingar við flestar þær raddir sem þróaðar hafa verið innan Máltækniáætlunarinnar, annars vegar gegnum vefþjónustu Tiro og hins vegar sem raddir sem keyra á símanum sjálfum. Raddirnar sem Símarómur notar voru þjálfaðar hjá Háskólanum í Reykjavík, Tiro ehf. þróaði TTS-vefþjónustuna sem Símarómur notar (sjá http://hdl.handle.net/20.500.12537/268)
  • Tokenizer for Icelandic text (2.0.3)

    Tokenizer is a compact pure-Python (2 and 3) executable program and module for tokenizing Icelandic text. It converts input text to streams of tokens, where each token is a separate word, punctuation sign, number/amount, date, e-mail, URL/URI, etc. It also segments the token stream into sentences, considering corner cases such as abbreviations and dates in the middle of sentences.
  • OCR Post-Processing Transformer Model 23.04

    ENGLISH During the project L11 - Error models for OCR of The Language Technology Programme 2019-2023, various OCR post-processing models were trained. This is the best performing one. On texts from the 19th century to the early 20th century, it reduces word error rate from 6.49% to 3.08%, and character error rate from 1.39% to 0.73%. On modern texts, it reduces word error rate from 5.52% to 3.60% and character error rate from 1.17% to 1.0%. More info, such as how to use the model for inference, in README. ICELANDIC Í verkefninu L11 - Error models for OCR í Máltækniáætlun 2019-2023 voru nokkur ljóslestrarvilluleiðréttingarlíkön þjálfuð. Þetta er best þeirra. Líkanið lækkar hlutfall orðavillna (e. word error rate) úr 6,49% í 3,08% í textum frá 19. öld og fyrri hluta 20. aldar og hlutfall stafvillna úr 1,39% í 0,73%. Í nútímamálstextum lækkar það hlutfall orðavillna úr 5,52% í 3,60% og hlutfall stafvillna úr 1,17% í 1,0%. Nánari upplýsingar, svo sem hvernig má nota líkanið, er að finna í meðfylgjandi README-skjali.
  • Upload2S3 (22.06)

    [ENGLISH] This project is a simple and straight forward way to upload podcast data like text files via a form to an AWS S3 bucket. This web application codebase is minimally derived from an existing ReactJS web application, samromur-chat. However, using this codebase does not require knowledge of samromur-chat. [ÍSLENSKA] Þetta verkefni býður upp á einfalda leið til þess að hlaða upp hlaðvarpsgögnum, t.d. textagögnum, á AWS S3. Kóðinn er lítillega byggður á ReactJS-forritinu samromur-chat. Ekki þarf þó þekkingu á samromur-chat til þess að nota þetta tól.
  • GreynirPackage 3.5.2 (22.10)

    GreynirPackage is a Python 3 package for working with Icelandic natural language text. Greynir can parse text into sentence trees, find lemmas, inflect noun phrases, assign part-of-speech tags and much more. Greynir's sentence trees can inter alia be used to extract information from text, for instance about people, titles, entities, facts, actions and opinions. Greynir uses the Tokenizer package, by the same authors, to tokenize text (see http://hdl.handle.net/20.500.12537/262). More information at https://github.com/icelandic-lt/GreynirEngine and detailed documentation at https://greynir.is/doc/. GreynirPackage er Python 3 pakki sem vinnur með íslenskan texta. Greynir þáttar texta í setningar, lemmar og markar texta, beygir nafnliði og margt fleira. Hægt er að nýta þáttunartrén sem tólið býr til í þeim tilgangi að draga upplýsingar út úr texta, til dæmis um manneskjur, starfstitla, sérnafnaeiningar, staðreyndir, atburði og skoðanir. Greynir notar Tokenizer-pakkann, eftir sömu höfunda, til að tilreiða texta (sjá http://hdl.handle.net/20.500.12537/262). Frekari upplýsingar má finna á https://github.com/icelandic-lt/GreynirEngine og ítarlega skjölun (á ensku) á https://greynir.is/doc/.