|
Post by hrafn on Sept 4, 2007 5:51:41 GMT -5
Í fyrirlestri ræddum við nokkur dæmi um nytsemi N-stæða í málvinnslu, t.d. í talgreiningu og mörkun. Við höfum gert ráð fyrir að n-stæðurnar væru myndaðar úr einstökum orðum eða mörkum.
Annar möguleiki er að n-stæðurnar séu myndaðar úr einstökum stöfum orðanna. Getið þið séð fyrir ykkur í hvers konar verkefnum þess konar n-stæður (n-stæðulíkön) geti komið að gagni?
|
|
|
Post by birnagu on Sept 4, 2007 9:13:19 GMT -5
Það eins sem mér dettur í hug í fljótu bragði væri að safna bara sérhljóðunum (eða atkvæðum) til að nýta við talgreiningu.
|
|
|
Post by bjarnia on Sept 4, 2007 9:21:59 GMT -5
Tjah.. gæti td verið svona stafsetningavilludetector þar sem þú þarft ekki að klára orðin.. td kæmi strax villa ef þú skrifar oo því að það er ekkert orð í íslensku sem er með oo í.. held ég allavega Siðan held ég að eitthvað svona sé örugglega notað í símanum mínum þegar ég er að skrifa SMS (slekk alltaf á því samt því ég skrifa ekki á ensku).. þannig virkar það að ég byrja á orði og hann giskar á restina af orðinu alltaf... verður alltaf nákvæmara og nákvæmara eftir hversu margir stafir eru komnir inn..
|
|
|
Post by hrafn on Sept 5, 2007 9:20:10 GMT -5
Siðan held ég að eitthvað svona sé örugglega notað í símanum mínum þegar ég er að skrifa SMS (slekk alltaf á því samt því ég skrifa ekki á ensku).. þannig virkar það að ég byrja á orði og hann giskar á restina af orðinu alltaf... verður alltaf nákvæmara og nákvæmara eftir hversu margir stafir eru komnir inn.. Hvaða n-stæður ætli séu notaðar? Tvístæður eða þrístæður eða fjórstæður eða ... ?
|
|
ida
New Member
Posts: 22
|
Post by ida on Sept 5, 2007 9:49:28 GMT -5
annað hvort skil ég ekki glærur eða þessi umræðu. en stendur ekki í glærum að tvístæð þyðir 2 orð en ekki 2 stafir?
|
|
|
Post by bjarnia on Sept 5, 2007 13:02:27 GMT -5
annað hvort skil ég ekki glærur eða þessi umræðu. en stendur ekki í glærum að tvístæð þyðir 2 orð en ekki 2 stafir?
|
|
ida
New Member
Posts: 22
|
Post by ida on Sept 5, 2007 14:07:39 GMT -5
aaaaaaah, þá á bara að nota n-stæður þar sem m<=n er fjöldi stafir sem búið er að inntaka og n er bara lengð af lengsta orð í orðaskrá. sem þyðir að ef orð er til með þeim m stöfum þá er þetta m-stæður, annars á að skoða hvort möguleiki er á að fá (m+i)-stæður orð úr inntakið ef i stafir í viðbót verða tekin inn.
getur verið eitthvað svoleiðis kannski?
|
|
ida
New Member
Posts: 22
|
Post by ida on Sept 5, 2007 14:08:55 GMT -5
gleymdi að segja (m+i)<=n ;o)
|
|
|
Post by indridi on Sept 7, 2007 8:09:45 GMT -5
N stæður má nýta til að áætla hvaða orð standa líklega saman. Til dæmis má nefna til dæmis, þar sem orðin til og dæmis mynda tvístæðu. Þessa einingu má svo nota til að kanna orða runu og þannig réttleika hennar.
Svo væri einnig hægt að nota þær til að finna skammstafanir.
|
|
|
Post by hrafn on Sept 7, 2007 13:01:55 GMT -5
Hvernig gæti maður notað n-stæður til að spá fyrir um úr hvaða tungumáli tiltekinn texti kemur?
|
|
ida
New Member
Posts: 22
|
Post by ida on Sept 7, 2007 13:41:14 GMT -5
það eru nokkur orð til í hverju tungumál sem hafa mjög há likindi á að koma fram í setningum. t.d. greinir í þysku. það þurfti að ákveða á einhvern n sem er nógu stór til að hafa nógu hátt likindi á að finna eitt af þeim líklegastum orðum þar. svo að það þarf að vera með orðaskrá með t.d. 10 eða 20 orðum úr hverji tungumál og bera þeim saman með þeim n orðum.
|
|
|
Post by indridi on Sept 8, 2007 15:45:45 GMT -5
Hvernig gæti maður notað n-stæður til að spá fyrir um úr hvaða tungumáli tiltekinn texti kemur? Komi tvístæðan ". The" fyrir í texta er það mjög líklega enska. Tvístæðurnar ". Hann" og ". Hún" gera sama gagn í íslensku. Slíkt verður þó tæplega afgerandi en með því að safna slíkum N- stæðum gætum við greint texta og ákvarða tungumálið út frá því en væri óákveðið annars.
|
|
ida
New Member
Posts: 22
|
Post by ida on Sept 8, 2007 20:55:13 GMT -5
en það virkar nú ekki í öllum tungumálum. þar sem orðaröð í setningum er öðruvissi finnst ekki orð sem byrja oft setningar. það er frekkar hægt að finna pör eins og t.d. "ég er/var" hm ... en það er samt ekki heldur rétt í öllum tungumálum.
|
|
|
Post by birnagu on Sept 9, 2007 13:25:18 GMT -5
ég myndi prófa að bera saman 10 algengustu n-stæður í textanum við 10 algengustu n-stæður í þeim tungumálum sem ég ætti til. (þar sem n-stæði væri líklega 1-stæða sökum leti) og velja það tungumál sem væri með flestar sömu n-stæður.
|
|
|
Post by indridi on Sept 10, 2007 4:47:00 GMT -5
en það virkar nú ekki í öllum tungumálum. þar sem orðaröð í setningum er öðruvissi finnst ekki orð sem byrja oft setningar. það er frekkar hægt að finna pör eins og t.d. "ég er/var" hm ... en það er samt ekki heldur rétt í öllum tungumálum. Nei ég veit það þarf að finna N stæður í öllum tungumálum til að vinna með. Sértu búinn að finna einkennandi n stæðu sem er reiknilega fýsileg, geturðu notað hana til að ákvarða tungumálið. Þannig þegar þú ert búinn að finna einkennandi n stæðu ertu kominn með ákveðin líkindi fyrir því að um sé að ræða viðkomandi tungumál. Það ætti að vera hægt að finna einkennandi n stæðu í flestum tungumálum.
|
|