Премини към съдържанието
jojopara

програма за сравняване и отчитане на използваните думи

    Препоръчан отговор


    Здравейте. 

     

    Търся програма, която да може да сравнява, отчита и брои използвания набор думи от един файл в друг.  Искам да създавам текстове от набор думи, които задължително да се използват няколко пъти и да знам колко и къде.   За Линукс (и Уиндоуз!.

     

    Благодаря!

    Редактирано от jojopara (преглед на промените)

    Сподели този отговор


    Линк към този отговор
    Сподели в други сайтове

    преди 29 минути, jojopara написа:

    Здравейте. 

     

    Търся програма, която да може да сравнява, отчита и брои използвания набор думи от един файл в друг.  Искам да създавам текстове от набор думи, които задължително да се използват няколко пъти и да знам колко и къде.   За Линукс (и Уиндоуз!.

     

    Благодаря!

    Това, което искате се нарича честотен речник. И а Линукс (за текстови файл) става със следната команда:

    uniq -c filename

    Това ще ви изкара на екрана лист със уникалните думи и колко пъти се срещат в текста. Ако трябва да се игнорират препинателните знаци командата ще е нещо такова:

    sed 's/./ /g' filename|sed 's/,/ /g'|uniq -c

     

    Редактирано от capnemo (преглед на промените)
    • Харесва ми 2

    Сподели този отговор


    Линк към този отговор
    Сподели в други сайтове

    Да, знам че се нарича честотен речник и точно с такъв смятам да работя.

     

    /media/7CEE98570E70DD80/My Documents $ uniq -c S_4 En.odt
    uniq: S_4: No such file or directory

     

     

     

    Сподели този отговор


    Линк към този отговор
    Сподели в други сайтове
    преди 14 минути, jojopara написа:

    Да, знам че се нарича честотен речник и точно с такъв смятам да работя.

     

    /media/7CEE98570E70DD80/My Documents $ uniq -c S_4 En.odt
    uniq: S_4: No such file or directory

     

     

     

    1. това няма да работи върху документи които не са чист текст (odt има вътре доста друга информация)

    2. Когато ползвате командна линия трябва да имате предвид специални символи в имената на файловете. Пробвайте така:

    uniq -c "S_4 En.odt"

    или така

    uniq -c S_4\ En.odt

     

    Сподели този отговор


    Линк към този отговор
    Сподели в други сайтове

    Разбрах от опит, че само текстови файлове се обработват така.

     

    Тази команда работи, но ми излизат всички "маймуни" от текса.

     

    Намерих интересен сайт по темата:

    http://www.textfixer.com/

     


    Сподели този отговор


    Линк към този отговор
    Сподели в други сайтове
    преди 34 минути, jojopara написа:

    Разбрах от опит, че само текстови файлове се обработват така.

     

    Тази команда работи, но ми излизат всички "маймуни" от текса.

     

    Намерих интересен сайт по темата:

    http://www.textfixer.com/

     

    Аз ви го написах по-горе (за текстовите файлове)...

    Сподели този отговор


    Линк към този отговор
    Сподели в други сайтове
    на 18.08.2016 г. в 10:12, jojopara написа:

     

    Здравейте. 

     

     

    Търся програма, която да може да сравнява, отчита и брои използвания набор думи от един файл в друг.  Искам да създавам текстове от набор думи, които задължително да се използват няколко пъти и да знам колко и къде.   За Линукс (и Уиндоуз!.

     

    Благодаря!

    Основни познания на Microsoft Excel и ще си свършиш работата.Лека вечер

    Сподели този отговор


    Линк към този отговор
    Сподели в други сайтове

    Регистрирайте се или влезете в профила си за да коментирате

    Трябва да имате регистрация за да може да коментирате това

    Регистрирайте се

    Създайте нова регистрация в нашия форум. Лесно е!

    Нова регистрация

    Вход

    Имате регистрация? Влезте от тук.

    Вход


    ×

    Информация

    Този сайт използва бисквитки (cookies), за най-доброто потребителско изживяване. С използването му, вие приемате нашите Условия за ползване.