Здавалка
Главная | Обратная связь

Задание 1. Обработка текста с веб-страницы



Рис. 25

На рисунке (рис. 25) приведен фрагмент сканированного текста. Вы видите, что программа распознавания текста в конце каждой строки добавила символ «разрыв строки». В данном случае эти символы мешают форматированию. Если мы попытаемся изменить размер шрифта, то получится так, как на рис. 26.Кроме того, символы переноса распознаны как знак «дефис». В результате части одного слова понимаются программой проверки правописания как разные слова, что отображено подчеркиванием красной волнистой линией. Чтобы получить правильный текст, надо удалить символы «разрыв строки» и удалить дефисы, расположенные в конце строки. Если делать это вручную, то работа займет достаточно много времени, особенно, если текст большой. Для быстрого выполнения работы надо использовать инструмент автоматического поиска и замены и с помощью него удалять «лишние» символы.

Рис. 26

При удалении «лишних» символов надо продумать, как правильно задать опрецию поиска и замены. Обратите внимание, что если просто задать поиск символов «дефис» и их удалить, то удалятся также нужные символы «дефис» в середине текста. Если просто удалить символы «разрыв строки», то после этой операции могут получиться половинки слов, или наоборот «склеятся» два слова. Поэтому прежде чес применять инструмент надо продумать алгоритм работы и правильно описать каждую операцию поиска и замены.

Такие же «ненужные» символы часто встречаются и в тексте, скопированном с веб-страниц. Кроме того на веб-страницах для абзацного отступа первой строки используются знаки пробелов.

В данном задании надо проанализировать текст из файла Геоинформационные системы, продумать, как правильно удалить «лишние символы» и обработать текст.

Технология выполнения задания

1. Откройте файл Геоинформационные системы.

2. Включите режим отображения непечатаемых символов. Найдите в конце строк символы «разрыв строки» и «дефис», играющий роль переноса.

3. Щелкните в начале текста.

4. На вкладке Главная в группе Редактирование щелкните по кнопке Найти.

5. В окне Найти и заменить на вкладке Заменить в строке Найти введите два символа «дефис»+«разрыв строки». Символ «разрыв строки» найдите в списке кнопки Специальный.

6. В строке Заменить ничего не вводите.

7. Щелкните по кнопке Заменить все. Просмотрите результат работы команды – слова, имевшие перенос в конце строки «склеились». Если результат не такой, значит, условие в команде было задано не совсем точно.

8. После выполнения операции задайте другое условие поиска. В строке Найти введите символ «разрыв строки».

9. В строке Заменить введите символ «пробел».

10. Щелкните по кнопке Заменить все.

11. Найдите в тексте группы по 6 пробелов, используемых в начале абзаца для отступа от левого поля. Для удаления пробелов в строке Найти удалите предыдущий критерий поиска и наберите 6 пробелов, в строке Заменить не набирайте ничего.

12. Щелкните по кнопке Заменить все.

13. Найдите в тексте пробелы в начале каждого нового абзаца. Их тоже надо удалить. Чтобы найти пробелы только в начале каждого нового абзаца, надо искать группу символов «знак абзаца» и пробел. Наберите это в строке Найти, удалив предыдущий критерий поиска. В строке Заменить не наберите символ «знак абзаца».

14. Щелкните по кнопке Заменить все.

15. Если в тексте образовались группы по 2 пробела (такое бывает при использовании поиска и замены символов) задайте критерий, найти 2 пробела и заменить на 1 пробел.

Объясните, почему мы использовали именно указанные критерии поиска.

Можно ли было бы задать другие условия, чтобы решить данную задачу? Можно ли было применять критерии поиска и замены в другой последовательности?

Попробуйте оценить, во сколько раз быстрее выполнена правка текста с помощью команды поиска и замены, чем если бы вы это делали «вручную».

 







©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.