Нужно отсортировать слова в тексте по алфавиту. Как можно сделать?
Нужно отсортировать слова в тексте по алфавиту. Как можно сделать?
Демидова Татьяна
Наверняка есть такие, но искать наверное дольше, чем реализовать в 1С
С уважением, Рустам.
"Пишите письма мелким почерком" :-). Ответ ГАРАНТИРОВАН
Небольшой текст можно отсортировать с помощью Word'a и Excel'я.
Программ таких море, но что конкретно требуется?
Всех благ!!!
Чувелёв Андрей
ps: Всё вышеизложенное является моим частным мнением и не может претендовать на полноту изложения.
А вот в Unix'e/Linux'e есть команда sort.
Типовое решение:
$ cat my_file | sort > my_sorted_file
Татьяна, в каком формате текст и чем разделены слова в нем?отсортировать слова в тексте по алфавиту. Как можно сделать?
Для сортировки в Word сортируемые элементы должны быть отдельными абзацами (или ячейками таблицы). Команда меню "Таблица\Сортировка". Установить тип "Текст". Нажав кнопку "Параметы" в диалоговом окне, выбрать язык.
Последний раз редактировалось Финдер; 05.11.2002 в 11:49.
Друзья, есть текст на 4-5 страницах (например в блокноте). Нужно все его слова отсортировать по алфавиту. Текст считаем художественным, например НК.
я сама это не умеюискать наверное дольше, чем реализовать в 1С
уж не вручную ли? в экселе можно вручную ввести текст в различные ячейки и отсортировать. А если в одну? все 4 страницы? а в ворде как?Небольшой текст можно отсортировать с помощью Word'a и Excel'я
Андрей - ну почему непонятно что требуется? имеется текст в блокноте. Требуется отсортировать все его слова по алфавиту!Программ таких море, но что конкретно требуется?
Можете меня ругать. но я даже не знаю как выглядят юникс и линукс!А вот в Unix'e/Linux'e есть команда sort
текст в стандартном формате - художественный с предложениями, абхацами. Слова разделены пробелами, знаками препинания.Татьяна, в каком формате текст и чем разделены слова в нем?
для этого мне придется вручную разбивать каждое слово на отдельный абзац! это практически невозможно!Для сортировки в Word сортируемые элементы должны быть отдельными абзацами (или ячейками таблицы).
Демидова Татьяна
D Word'е выделяется текст, затем таблица/преобразовать в таблицу. Таблицу можно перенести потом в Excel и сделать там с ней все что угодно, затем вернуть в Word и таблица/преобразовать в текст.уж не вручную ли? в экселе можно вручную ввести текст в различные ячейки и отсортировать. А если в одну? все 4 страницы? а в ворде как?
текст преобразовывается в таблицу по абзацам, в каждом их которых много слов. Как пройти эту сложность?таблица/преобразовать в таблицу
Демидова Татьяна
Да, НК – это действительно большая литература.Текст считаем художественным, например НК.Вручную – это не вариант. Предлагаю все же воспользоваться Вордом, использовав средства малой механизации , имеющиеся в нем. Это быстро, нужно только аккуратно в определенном порядке пройти по пунктам. В результате получим очищенные от знаков препинания слова и числа в алфавитном порядке.мне придется вручную разбивать каждое слово на отдельный абзац! это практически невозможно!
1. Полностью копируешь текст в чистый документ Word.
2. Ставишь курсор в самое начало.
3. Открываешь диалоговое окно замены (Ctrl-H или «Правка\Заменить»). Нам понадобится кнопка «Специальный» в правом нижнем углу. Если ее там нет, нажать, чтобы появилась, расположенную там же кнопку «Больше». Далее работаем с диалоговым окном, не закрывая его.
4. Убиваем знаки препинания следующим образом (при этом неоднократно придется менять содержимое полей «Найти» и «Заменить на». Каждый раз для стирания их прежнего содержания нужно выделять все содержимое поля, следя за тем, чтобы там случайно не остался лишний пробел).
4.1. В поле «Найти» вводим пробел и черточку (« -», только без кавычек), в поле «Заменить на» пробел (« »). Нажимаем «Заменить ВСЕ».
4.2. Выделяем поле «Найти» и вместо того, что было там в п. 4.1, вводим черточку и пробел («- »). «Заменить на» оставляем, как было. Кнопка «Заменить ВСЕ». Тем самым мы избавились от всех тире, при этом не порубав слова с дефисом внутри.
4.3. «Найти»: точка («.»). «Заменить на»: пустое поле или пробел. Лучше пробел – корректнее сработает при наличии ошибок в изначальном тексте. «Заменить ВСЕ».
4.4.-4.хх То же для прочих знаков препинания , ; : ! ? " ( ) * / \ + = и если есть еще что более экзотическое в этом духе. В результате не останется ничего, кроме слов и чисел. Всё разделено пробелами и несколькими оставшимися абзацами.
5. Теперь основная задача – разбиение слов абзацами. Это совсем не сложно. Мы должны все пробелы заменить на символы абзацев. Очищаем поле «Найти» и вводим туда один (!) пробел. Очищаем поле «Заменить на» и ставим в него текстовый курсор. Нажимаем кнопку «Специальный» и выбираем из списка «Символ абзаца» (или можно вручную ввести в поле комбинацию «^p» без кавычек). Нажимаем «Заменить ВСЕ». В результате на каждой строке должно остаться одно слово.
6. Делаем сортировку, как уже было описано («Таблица\Сортировка»). Окно замены при этом можно все еще не закрывать.
7. Если слова нужны не разбитыми на абзацы, а подряд, то производим аналогично п. 5 обратную замену символов абзаца на пробелы.
8. Закрываем окно замены («Отмена»). Результат готов. Можно, если нужно, копировать его обратно в блокнот.
Все это очень быстро. Дольше читать мою инструкцию, чем ее выполнять. Вот пробный результат, полученный по такой методике (это было моим предыдущим сообщением в этой ветке):
Word абзацами быть в в в в выбрать диалоговом Для должны и или каком кнопку Команда меню Нажав нем окне отдельными Параметы разделены слова Сортировка сортировки сортируемые Таблица таблицы Татьяна Текст текст тип Установить формате чем элементы язык ячейками
Процесс занял у меня (заметил время) 5 минут без спешки. Длинный текст потребует ровно столько же времени, поскольку все операции автоматизированы. Попробуй. Все должно получиться. Если что-то будет не так, сообщи.
Татьяна, а для чего это все? А то можно еще что-нибудь дополнительно сделать, например, убрать заглавные буквы в начале некоторых слов или, наоборот, все привести к такой форме и т.п.
Последний раз редактировалось Финдер; 05.11.2002 в 16:11.
Боря, позволь мне сказать тебе, что ты - ГЕНИЙ!
Я восхищена твоим объяснением, у меня все получилось!!!
Действительно все просто и понятно.
Однако могу сказать, что я переоценивала свои знания ВОРД!
Или это мужская логика логичнее женской?
Это мне нужно для исследований текстов.Татьяна, а для чего это все?
пожалуй мне нужно взять у тебя уроки Ворда.
Думаю, что остальное вряд ли возможно средствами ВОРД. но можно и поделиться: нужно отсортировать существительные от прилагательных глаголов и местоимений.
А еще как в экселе сделать сумму, забитую цифрами в соседней ячейке прописью? что надо написать?
Демидова Татьяна
Татьяна, вам похоже надо учиться работать с базами данных. Простейшая База Данных - это Excel.
У Вас информация представлена сейчас в виде строчек, т.е практически БД и можете проводить анализ и выборки.
P.S. С Уважением к Боре - это же сколько надо иметь духа, что бы такие простые вещи объяснять простым языком и не лениться набирать столько текста!!!!!
Zloben
согласна полностью. Вы предлагаете мне идти на курсы или осваивать самой?Татьяна, вам похоже надо учиться работать с базами данных. Простейшая База Данных - это Excel.
До сих пор остались проблемы:
1) отделения существительных от прилагательных и глаголов автоматически. не подскажете как это сделать? можно не так подробно, как Борис!
2) сортировка по количеству букв в слове.
3) подсчет количества одинаковых слов
4) поиск неповторяющихся слов.
Последний раз я это делала в dbase III plus. Лет n-ть назад.
что имеется теперь?
Последний раз редактировалось Демидова Татьяна; 05.11.2002 в 17:35.
Демидова Татьяна
Преувеличиваешь, хотя приятно, конечно.ты - ГЕНИЙ!MS Office почти так же неисчерпаем, как электрон и атом. ("Электрон так же неисчерпаем, как и атом", - В.И.Ленин)могу сказать, что я переоценивала свои знания ВОРД!Всегда рад, если могу чем помочь.пожалуй мне нужно взять у тебя уроки Ворда.Да, это Ворду, пожалуй, не под силу.Думаю, что остальное вряд ли возможно средствами ВОРД: нужно отсортировать существительные от прилагательных глаголов и местоимений.Это не просто. Такой встроенной возможности нет. В программах заполнения первичных документов на базе Excel для этого пишут дополнительную функцию.А еще как в экселе сделать сумму, забитую цифрами в соседней ячейке прописью? что надо написать?Совершенно верно. Причем повторить это несколько раз (пока не будет найдено 0 комбинаций), чтобы убрать тройные, четверные и т.д. пробелы/абзацы.убрать лишние пробелы:
найти - 2 пробела
заменить - один пробел?
убрать пустые строки
найти - два символа абзаца
заменить - один символ абзаца?Если все слова поставлены в одну строку, то:а как убрать слова из количества букв меньше 2х?
Найти: “ ^$^$ ” (пробел + дважды “Специальный\Любая буква” + пробел).
Заменить: пробел.
Если слова разбиты по абзацам, то вместо пробелов – символы абзаца (“^p”). Добавлять в поиск символы, которые слово должны окружать (в данном случае пробелы или абзацы), нужно, так как иначе будут искаться не только слова из двух букв, но и части длинных слов. Так же, как с двойными пробелами/абзацами, повторять нажатие «Заменить все», пока не исчерпаются идущие друг за другом короткие слова.
Это все для слов из двух букв. Для однобуквенных придется повторить аналогичную операцию. Впрочем, это можно сделать попроще в Экселе.Можно в Excel. Напишу.ах, да, еще подсчет одинаковых слов!
Истину говорю, не преувеличиваю!Преувеличиваешь, хотя приятно, конечно.
Боря, я тут кое-что поменяла в ветке, так что спрошу еще раз (наберусь смелости, я знаю, что ты не откажешь!)Впрочем, это можно сделать попроще в Экселе. Можно в Excel. Напишу.
2) сортировка по количеству букв в слове.
3) подсчет количества одинаковых слов
4) поиск неповторяющихся слов.
Ворд или Эксель - неважно.
Демидова Татьяна
Для этого нужны какие-то другие программы.До сих пор остались проблемы:
1) отделения существительных от прилагательных и глаголов автоматически.Например, так. Сразу говорю, одни и те же слова в разных падежах, числах, родах (т.е., с разными окончаниями) будут считаться различными. Лингвистический анализ находится вне тех простых методик, которые могут быть реализованы средствами MS Office.2) сортировка по количеству букв в слове.
3) подсчет количества одинаковых слов
4) поиск неповторяющихся слов.
Имеем список слов, разделенных символами абзаца, который сформирован в Ворде. Копируем его весь. Открываем Эксель. Встаем на пересечение второй строки и первого столбца чистого листа. Вставляем скопированный массив. Слова должны разложиться в первом столбце по строчкам, начиная со второй. Открываем «Сервис \ Параметры \ Общие». Устанавливаем флажок «стиль ссылок R1C1».
Если слова отсортированы по алфавиту, приступаем ко вводу формул. Если нет, перед этим делаем сортировку («Данные \ Сортировка» или кнопка с буквами А-Я на панели инструментов «Стандартные»).
В ячейку R2C2 (справа от первого слова) вводим формулу:
а) =ЕСЛИ(СОВПАД(СТРОЧН(RC[-1]);СТРОЧН(R[1]C[-1]));R[1]C+1;1), если хотим сравнивать слова независимо от регистра букв;
б) =ЕСЛИ(СОВПАД(RC[-1];R[1]C[-1]);R[1]C+1;1), если хотим сравнивать слова с учетом регистра.
Напоминаю, при желании можно все слова привести к одному регистру еще в Ворде.
В ячейку R2C3 (еще правее): =ЕСЛИ(RC[-1]<R[-1]C[-1];0;RC[-1]);
В ячейку R2C4: =ДЛСТР(RC[-3]).
Копируем заполненные формулами ячейки R2C2-R2C4 вниз по столбцам для всего массива слов. Значения во втором столбце вспомогательные. В третьем столбце – количество повторений слова, в четвертом – его длина. Количество экземпляров каждого слова указано только для первого из них, напротив остальных в третьем столбце стоят нули.
Теперь нужно снова воспользоваться сортировкой. Сортировка в Экселе гробит формулы. Точнее, сами формулы остаются неизменными, но указывают уже не на те ячейки. Поэтому формулы придется заменить на их значения. Для этого выделяем и копируем второй-четвертый столбцы, а затем, никуда не двигаясь, вызываем «Правка \ Специальная вставка», ставим переключатель на «значения», нажимаем «Ok». Теперь второй столбец можно удалить, он больше не нужен. Делаем сортировку по количеству повторений и удаляем строки с нулевым значением в этом столбце (напоминаю, это лишние клоны одинаковых слов).
Все, массив готов. Напротив каждого слова указано количество его упоминаний в тексте и длина. Его (массив) можно сортировать по первому столбцу (т.е., по алфавиту), по второму – количеству повторений (единицами в нем обозначены неповторяющиеся слова), по третьему – количеству букв (тогда легко стереть вставшие подряд строки с короткими словами). Для сортировки по тому или иному столбцу достаточно встать на любую строку в нем и нажать кнопку сортировки на панели инструментов. А если пользоваться командой «Данные \ Сортировка», то можно делать вложенную сортировку по всем столбцам в произвольной последовательности.
Боря, огромное спасибо!
Буду изучать! Про единый регистр в ворде не говори - я попробую сама догадаться!
Демидова Татьяна
Макрос для ExcelА еще как в экселе сделать сумму, забитую цифрами в соседней ячейке прописью? что надо написать?
Эту тему просматривают: 1 (пользователей: 0 , гостей: 1)