Обработка текстов

Редакция Без Сменки
Честно. Понятно. С душой.

В КЕГЭ по информатике появились новые задания с обработкой больших текстов. Такие задания можно решить несколькими эффективными способами и сейчас мы их рассмотрим 🙂

Задание:
Дан отрывок из произведения, нужно посчитать сколько раз встретилось слово “долг” в отрывке, при этом не считать те слова, где слово долг, является началом или окончанием другого слова(например: долги, долгами, незадолго).

Варианты решения:
📍Открываем Word/Блокнот и жмем Ctrl+F — вводим наше слово “долг” и проверяем, что все подходило. В некоторых текстовых редакторах при поиске можно поставить галочку, что слово будет искаться сразу целиком или еще будет учитывать регистр. Удобно!

📍Вариант для прогеров, почему бы не решить это с помощью Python.
Выглядеть будет это как-то так:

with open («1.docx») as f:
lines = f.readlines()

Затем, каждую строчку поделим на слова с помощью функции split() и пройдемся по ним. !Важный момент — не забудем превратить все слова в нашей строке в нижний регистр, так как все варианты нахождения слово “долг”: ДОЛГ, долг, Долг, ДОлг, ДОЛг…. — нам могут подойти.

Если слово подходит — будем увеличивать переменную = количеству таких слов, что будет ответом к задаче.

 

Где вы учитесь?

Вам также будет интересно

ЗАДАНИЕ 15 | воспроизводство населения
V тип — воспроизводство населения 📚 Теория для задания: 📜 Алгоритм решения: ① Анализируем высказывания; ② Выбираем подходящие и...
Сила рандома или дрейф генома
А что такое «дрейф»? С чем ассоциации? «Дрейфующая льдина», «дрейфующий корабль». Это означает, что объекты отдались воле Посейдона и плывут туда,...
Юридическая ответственность
⭐ Признаки юридической ответственности:  1) устанавливается государством в правовых нормах;  2) опирается на государственное принуждение;  3)...
Эксперименты из задания 22 в ЕГЭ по биологии
В этой шпаргалке мы собрали подборку экспериментов, которые могут попасться в 22 задании ЕГЭ по биологии. Разбираем: Опыт с устьицами; ...
Кодирование паролей
N цветов кодируется log2(N) битами Каждое измерение звука кодируется X битами. Что-то произвольное тоже кодируется точно также. Очень любят...
ФОРМУЛЫ (БЕССМЕРТИЯ) КОРНЕЙ
✅ Корень — универсальное название, которое есть в разных предметах. В русском языке корень — это главная часть слова, в биологии корень — это...

0 комментария

Авторизуйтесь, чтобы оставить комментарий.