Задание 1. Обработка текста с веб-страницы
Рис. 25 На рисунке (рис. 25) приведен фрагмент сканированного текста. Вы видите, что программа распознавания текста в конце каждой строки добавила символ «разрыв строки». В данном случае эти символы мешают форматированию. Если мы попытаемся изменить размер шрифта, то получится так, как на рис. 26.Кроме того, символы переноса распознаны как знак «дефис». В результате части одного слова понимаются программой проверки правописания как разные слова, что отображено подчеркиванием красной волнистой линией. Чтобы получить правильный текст, надо удалить символы «разрыв строки» и удалить дефисы, расположенные в конце строки. Если делать это вручную, то работа займет достаточно много времени, особенно, если текст большой. Для быстрого выполнения работы надо использовать инструмент автоматического поиска и замены и с помощью него удалять «лишние» символы. Рис. 26 При удалении «лишних» символов надо продумать, как правильно задать опрецию поиска и замены. Обратите внимание, что если просто задать поиск символов «дефис» и их удалить, то удалятся также нужные символы «дефис» в середине текста. Если просто удалить символы «разрыв строки», то после этой операции могут получиться половинки слов, или наоборот «склеятся» два слова. Поэтому прежде чес применять инструмент надо продумать алгоритм работы и правильно описать каждую операцию поиска и замены. Такие же «ненужные» символы часто встречаются и в тексте, скопированном с веб-страниц. Кроме того на веб-страницах для абзацного отступа первой строки используются знаки пробелов. В данном задании надо проанализировать текст из файла Геоинформационные системы, продумать, как правильно удалить «лишние символы» и обработать текст. Технология выполнения задания 1. Откройте файл Геоинформационные системы. 2. Включите режим отображения непечатаемых символов. Найдите в конце строк символы «разрыв строки» и «дефис», играющий роль переноса. 3. Щелкните в начале текста. 4. На вкладке Главная в группе Редактирование щелкните по кнопке Найти. 5. В окне Найти и заменить на вкладке Заменить в строке Найти введите два символа «дефис»+«разрыв строки». Символ «разрыв строки» найдите в списке кнопки Специальный. 6. В строке Заменить ничего не вводите. 7. Щелкните по кнопке Заменить все. Просмотрите результат работы команды – слова, имевшие перенос в конце строки «склеились». Если результат не такой, значит, условие в команде было задано не совсем точно. 8. После выполнения операции задайте другое условие поиска. В строке Найти введите символ «разрыв строки». 9. В строке Заменить введите символ «пробел». 10. Щелкните по кнопке Заменить все. 11. Найдите в тексте группы по 6 пробелов, используемых в начале абзаца для отступа от левого поля. Для удаления пробелов в строке Найти удалите предыдущий критерий поиска и наберите 6 пробелов, в строке Заменить не набирайте ничего. 12. Щелкните по кнопке Заменить все. 13. Найдите в тексте пробелы в начале каждого нового абзаца. Их тоже надо удалить. Чтобы найти пробелы только в начале каждого нового абзаца, надо искать группу символов «знак абзаца» и пробел. Наберите это в строке Найти, удалив предыдущий критерий поиска. В строке Заменить не наберите символ «знак абзаца». 14. Щелкните по кнопке Заменить все. 15. Если в тексте образовались группы по 2 пробела (такое бывает при использовании поиска и замены символов) задайте критерий, найти 2 пробела и заменить на 1 пробел. Объясните, почему мы использовали именно указанные критерии поиска. Можно ли было бы задать другие условия, чтобы решить данную задачу? Можно ли было применять критерии поиска и замены в другой последовательности? Попробуйте оценить, во сколько раз быстрее выполнена правка текста с помощью команды поиска и замены, чем если бы вы это делали «вручную».
©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.
|