Tema: Re: klausimelis programeriams apie teksto panasumus
Autorius: fenix
Data: 2018-07-22 21:11:20
2018.07.22 20:38, tranzoo rašė:
> On 7/22/2018 15:35, fenix wrote:
>> Turime keliasdesimt tukstanciu teksto vienetu. tekstai nuo 500 iki 5000
>> zodziu mazdaug. Visi parasyti lietuviu kalba, su lietuviskomis raidemis.
>> Jokiu indeksu, jokiu tegu ir pan zymiu nera. Tik pliki tekstai.
>> Paparastumo delei tarkime, kad juos galiu sukishti i bet koki formata:
>> doc, mysql duombaze, txt failai ir pan.
>>
>> kokie butu automatiniai sprendimai issirinkus bet kuri teksta N, surasti
>> tarkim 5 panasiausius i juos kitus??? jeigu dar bet kokia panasumo
>> skaitine israiska generuoti - butu super. Cia kazkas panasaus i plagiato
>> paieska ;) Tiesa, gali but ir veikiantis algoritmas, pasiprograminciau.
>> Online sprendimas, kur leidzia tik atlikti kelias operacijas - irgi
>> neidomu...
>>
>> trumpai: panasiu lietuvisku tekstu paieska.
>>
>> dekui uz idejas. sprendimai EN kalbai irgi is esmes tiktu, tik turi buti
>> pritaikomi LT kalbai.
>>
> 
> google 'sorting algorithms'

"sorting" turi kazka panasaus su panasaus teksto suradimu? Buble sort
manai pades?