Как отличить сканированный текст от напечатанного?

1

Каждому человеку, которому приходится много работать по набору и сканированию текстов, со временем становятся очевидными признаки, по которым очень легко отличить отсканированный текст от набранного текста вручную.
Рассмотрим наиболее часто встречающиеся достоверные признаки, которые очевидны при распечатке и могут быть заметны опытному взгляду непосредственно в текстовом редакторе.
Достоверными признаками отсканированного и распознанного текста являются:
1. Наличие лишних пробелов в тексте.
2. Путаница букв или их сочетаний: буква и с й и наоборот, ш с щ, гю с по, ю с го, и с к или н.
3. Наличие неоправданных разрывов абзацев посреди предложения или слов.
4. Пробелы или дефисы, а также дефисы с пробелами в середине слов, к примеру, пере- нос, про-бел, в сере дине.
5. Двойные апострофы ‘` и другие буквы в верхнем или нижнем регистре, а также мелким кеглем в неожиданных местах текста. По сути это неправильно распознанный программой «мусор» со страниц отсканированного оригинала.
6. Пробелы перед запятой или точкой или же их отсутствие после оных: «Например , мы можем увидеть,что»;
7. Точки вместо запятых и наоборот;
8. «Мягкие» переносы или разрывы слова (видны в текстовом редакторе).
Достоверными признаками не сканированного текста, а набранного вручную:
1. Наличие опечаток в виде замены соседних букв на клавиатуре. Например, это может быть путаница предлогов «в» или «с» (стандартные средства для проверки орфографии это не улавливают).
2. Пропущенные при наборе буквы или слова.
Вместе с тем, наличие в тексте длинных тире не может быть признаком того, что он отсканирован с книги, а дефисы «-» вместо необходимого тире «—» признаком самостоятельного набора текста. Каждый грамотный оператор по компьютерному набору знает отличия между минусом, дефисом или тире, а также знает, где и как правильно ввести их в текст. Кроме того, в последних версиях MS Word работает автоматическая замена одного или сразу двух дефисов с пробелами на длинное тире.
Согласно ГОСТу дефис используется в середине слов, а короткое тире — в начале списка или между числами, к примеру, 10–12. Длинное тире используется между словами в предложениях.
Поэтому, если быть лучше вооруженным в ситуациях, когда необходимо отстоять законность (или же скрыть незаконность) происхождения студенческой работы, можно реально отстоять свои права.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Можно использовать следующие HTML-теги и атрибуты: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>