Възможно ли е сравнително търсене?
Търся начин, чрез който с търсачка да остановя статистика на най-повтаращите се думи в даден текст. Но не искам във find с конкретна, а да излезе дирвктно коя е най-повтаряната дума в целия текста, коя е втора по повтаряемост и пр. Можеби за целта е нужен макрос? Знам, че моаже дума по дума, но в рботата ми ще ми бъде много полезно ако мога с един клик да остановя класацията на топ 5 най-повтарящи се думи в ткста.
Здравейте,
Първо интересен и нестандартен въпрос. Интересно ми е, ако не е проблем за вас да споделите в каква ситуация искате да използвате тази "статистика" .
Както и предполагате това следва да стане на база код ( VBA ).
Споделям един файл, които е със разширение .dotm в който template - тен файл се съдържа макроса който може съответно да ти свърши работа.
Тук : Count_words_in_word
Как работи?
Отваряте Template - ния файл може да го сложите в папката с Custom Templates или да го сложите да се зарежда директно всеки път.Това оставям на вашата преценка. Няма да влизам в подробности в курса има урок в който работата с template - и е обяснена :).
След като отворим съответно файла, ако имате включено Protect View съответно или го премахнете предварително или изберете на Enable Editing ( Снимка 1 позиция 1 ).
Същото се отнася и за протекцията спрямо макросите , изберете съответно Enable Content ( снимка 2 позиция 1 )
След което в раздела Add ins ( снимка 3 позиция 1 ), има една иконка Process report ( снимка 3 позиция 2 ). от която може да стартирате макроса.
На снимка 3 имам набързо набран текст, за който видно е че най - повтаряната дума в него е дума, но да приемем че не знаем това :) и се чудим коя е най - повтарямнат дума в документа :)
Стартирайки иконката Process report излиза прозореца показан на снимка 4 позиция 1. В който прозорец има доста голям избор от опции.
Съотвенто в раздела Settings ( снимка 4 позиция 2 ) избираме какво точно искаме да ни се появи като статистика избираме All words ( снимка 4 позиция 3 ), съответно за критерия по който искаме да бъдат сортирана статистиката избираме да е на база честотта ( снимка 4 позиция 4 ) - Sort by Frequency.
В раздела Output избираме пък къде да бъде поставена информацията, избираме да е в настоящия документ ( снимка 4 позиция 5 ) Appended to current document и кликаме на ОК.
Резултата е вмъкната таблица във Word в която имаме статистика на използваните думи в Word - снимка 5 позиция 1. Като съотвенто най - горе стой най - иползваната дума и съотвентно броя на използването ѝ.
Така че разгледайте опционолнатостта на тази "програмка" ( плъгин ) и мисля че следва да пасне още по - добре на казуса ви, макар да мисля че точно това искате да постигнете като ефект.
Надявам се да ти влезе в полза и да сме разрешили казуса.
Наистина много интересен въпрос. Първото решение, което ми идва наум е да се използва т.нар. графика Word cloud На този линк можете да прочетете повече подробности, както и да си направите такава: https://www.wordle.net/
изисква се просто да се пейстне текста и да се цъкне бутона Go
след което излиза графика, в която най-често използваните думи излизат с най-едър шрифт.
Не е много удобно обаче, ако искате да ги подредите в таблица, затова ще се опитам да намеря решение в Ексел без макрос (или с минимален такъв)
В Ексел става много лесно с PowerQuery. Само трябва текстът да се съхрани в txt формат и да се поцъка малко в началото.
Не знам какъв е текстът, за който става дума, нито как работи макросът на Краси Кръстев, но понеже за пробата ползвах книга от 100-на страници направи ми впечатление следното: * Трябва да се изчистят всички препинателни знаци, за да се различават "круша" от "круша," или "круша." * Ако има пряка реч, възможно е да се изброят много странни думи като " - " * В зависимост от текста на предни места могат да изскочат думи като "с", "и", "аз", "тя", които не знам дали представляват интерес * Възможно е да има и много числа, които също ще се броят като думи
Всъщност, това, за което пита господинът, си има име във филологията . Това не е списък , а се нарича ИНДЕКС. Индексите , съответно, биват възходящи и низходящи. Ние ползуваме такива честотни анализи в научните изследвания под мое ръководство. Резултати има.
Благодаря! Може да се направи такъв курс за ролята на компютъра в хуманитарните науки, и в частност в литературознанието, но засега съм като мечо Пух в средата на бърлогата - ни напред , ни назад! Иначе курсът ще проследи няколко важни насоки на възможни проучвания, както и ползата от тях Това не е откритие, нещата са известни на интересуващите се, но учените ги мързи, понеже е трудоемка, пипкава и неблагодарна работа.. Запазвам си тази тема, няма да е нещо обемно обаче, само насоките . това не е малко..