On 7/22/2018 15:35, fenix wrote: > Turime keliasdesimt tukstanciu teksto vienetu. tekstai nuo 500 iki 5000 > zodziu mazdaug. Visi parasyti lietuviu kalba, su lietuviskomis raidemis. > Jokiu indeksu, jokiu tegu ir pan zymiu nera. Tik pliki tekstai. > Paparastumo delei tarkime, kad juos galiu sukishti i bet koki formata: > doc, mysql duombaze, txt failai ir pan. > > kokie butu automatiniai sprendimai issirinkus bet kuri teksta N, surasti > tarkim 5 panasiausius i juos kitus??? jeigu dar bet kokia panasumo > skaitine israiska generuoti - butu super. Cia kazkas panasaus i plagiato > paieska ;) Tiesa, gali but ir veikiantis algoritmas, pasiprograminciau. > Online sprendimas, kur leidzia tik atlikti kelias operacijas - irgi > neidomu... > > trumpai: panasiu lietuvisku tekstu paieska. > > dekui uz idejas. sprendimai EN kalbai irgi is esmes tiktu, tik turi buti > pritaikomi LT kalbai. > google 'sorting algorithms'