Последствия осере...
Feb. 10th, 2012 04:34 pmКак вы наверное знаете, большинство книжек, которые размещены на электронных библиотеках, представляют собой отсканированные и склепанные файлы.
Насколько я понимаю, система переделывания бумажных книжек такова:
- Берут книгу и каждую ееную страничку сканируют
- Файлы множества страниц соединяют в один
- Полученный файл пропускают через специальную программу "Осере" OCR, которая графические картинки буковок распознает каким-то фотоаппаратным принципом и переводит в знакомые нам буквы формата "док".
- Полученный "док" проверяют грамматической исправлялкой и книжка готова!
Самому мне однажды на работе довелось присутствовать при создании такого файла. Коллега взяла какой-то журнал и принялась водить по строчкам ручной писюкающей машинкой. Та запоминала графику, а затем выдала на экране компьютера текст. Бля....лучше не буду объяснять, что там вышло. Буковки чуть ли не в каждом слове пришлось исправлять, так как машинка не видела разницы между "е" и "с". И не только...
А теперь о конкретном случае.
Не было у меня Интернета и вспомнил я о том, что где-то у меня валяется старинный, 2000-го года издания диск "Электронная библиотека". Несколько сот романов и прочих трудов человеческой мысли на русском языке.
Запустил я его, решив перечитать книжку Корецкого "Антикиллер". Она у меня и в бумажном варианте есть, но слишком мелкие буковки, лень напрягать глаза.
И вот читаю я, читаю...
Как всегда, одна и та же классическая ошибка - слово "мерс" (от мерседес) всюду МЕРЕ.
А затем натыкаюсь на пассаж и, прочитав его, чуть не падаю со смеху.
"Вещественным доказательством оказался отличающийся мощной светосилой
и повышенной разрешающей способностью компактный фотоаппарат "Минске" -
излюбленное средство всех разведок мира для пересъемки документов..."
и далее:
"...А когда Карнаухов получил рапорт подчиненного об обнаруженном у Га-
ленкова фотоаппарате "Минске" без пленки, вновь всплыла версия преда-
тельства..."
А теперь перенеситесь мысленно куда-нибудь в 2500-й год. Земная цивилизация давно разрушена, планета покинута, все заросло деревьями и травой, и лишь изредка из Космоса прилетают сюда инопланетные археологи - вести раскопки и изучать быт и культуру давно погибших людей.
И вот во время очередных раскопок на территории бывшей России они натыкаются ...о, чудо! на компакт-диск-библиотеку на русском языке! Какая невероятная находка!
Отвозят диск куда-нибудь к себе на Центавр или Альфу Кассиопеи и тамошние инопланетные археологи-русисты начинают материалы читать и изучать.
А затем пишут глубокомысленные труды:
"...В двадцатом веке на Земле исключительной популярностью у разведок пользовался фотоаппарат "Минске". Скорее всего, название этой всемирноизвестной в те времена марки фототехники происходит от белорусского города "Минск". Видимо на тамошнем секретном заводе и производился десятки лет сей высокоточный аппарат...".
А кто-нибудь может уже и сегодня, прочитав электронную версию "Антикиллера" так думает.
А на самом деле...
Откройте бумажный вариант. Никакого "Минске" или "Минск" не существует.
Программа "Осере" так прочитала и распознала незнакомое ей слово "МИНОКС". А человек, вычитывавший электронный вариант, или никогда о миноксах не слыхал, или вообще не обратил на странное слово внимание.
И сколько подобных ляпов бродит сейчас по Интернету...
Вот вам "Минокс". Его, кстати, с 1935 по 1943 годы производили и на ВЭФ в Риге, но отнюдь не в Минске...


Насколько я понимаю, система переделывания бумажных книжек такова:
- Берут книгу и каждую ееную страничку сканируют
- Файлы множества страниц соединяют в один
- Полученный файл пропускают через специальную программу "Осере" OCR, которая графические картинки буковок распознает каким-то фотоаппаратным принципом и переводит в знакомые нам буквы формата "док".
- Полученный "док" проверяют грамматической исправлялкой и книжка готова!
Самому мне однажды на работе довелось присутствовать при создании такого файла. Коллега взяла какой-то журнал и принялась водить по строчкам ручной писюкающей машинкой. Та запоминала графику, а затем выдала на экране компьютера текст. Бля....лучше не буду объяснять, что там вышло. Буковки чуть ли не в каждом слове пришлось исправлять, так как машинка не видела разницы между "е" и "с". И не только...
А теперь о конкретном случае.
Не было у меня Интернета и вспомнил я о том, что где-то у меня валяется старинный, 2000-го года издания диск "Электронная библиотека". Несколько сот романов и прочих трудов человеческой мысли на русском языке.
Запустил я его, решив перечитать книжку Корецкого "Антикиллер". Она у меня и в бумажном варианте есть, но слишком мелкие буковки, лень напрягать глаза.
И вот читаю я, читаю...
Как всегда, одна и та же классическая ошибка - слово "мерс" (от мерседес) всюду МЕРЕ.
А затем натыкаюсь на пассаж и, прочитав его, чуть не падаю со смеху.
"Вещественным доказательством оказался отличающийся мощной светосилой
и повышенной разрешающей способностью компактный фотоаппарат "Минске" -
излюбленное средство всех разведок мира для пересъемки документов..."
и далее:
"...А когда Карнаухов получил рапорт подчиненного об обнаруженном у Га-
ленкова фотоаппарате "Минске" без пленки, вновь всплыла версия преда-
тельства..."
А теперь перенеситесь мысленно куда-нибудь в 2500-й год. Земная цивилизация давно разрушена, планета покинута, все заросло деревьями и травой, и лишь изредка из Космоса прилетают сюда инопланетные археологи - вести раскопки и изучать быт и культуру давно погибших людей.
И вот во время очередных раскопок на территории бывшей России они натыкаются ...о, чудо! на компакт-диск-библиотеку на русском языке! Какая невероятная находка!
Отвозят диск куда-нибудь к себе на Центавр или Альфу Кассиопеи и тамошние инопланетные археологи-русисты начинают материалы читать и изучать.
А затем пишут глубокомысленные труды:
"...В двадцатом веке на Земле исключительной популярностью у разведок пользовался фотоаппарат "Минске". Скорее всего, название этой всемирноизвестной в те времена марки фототехники происходит от белорусского города "Минск". Видимо на тамошнем секретном заводе и производился десятки лет сей высокоточный аппарат...".
А кто-нибудь может уже и сегодня, прочитав электронную версию "Антикиллера" так думает.
А на самом деле...
Откройте бумажный вариант. Никакого "Минске" или "Минск" не существует.
Программа "Осере" так прочитала и распознала незнакомое ей слово "МИНОКС". А человек, вычитывавший электронный вариант, или никогда о миноксах не слыхал, или вообще не обратил на странное слово внимание.
И сколько подобных ляпов бродит сейчас по Интернету...
Вот вам "Минокс". Его, кстати, с 1935 по 1943 годы производили и на ВЭФ в Риге, но отнюдь не в Минске...


no subject
Date: 2012-02-11 09:43 am (UTC)no subject
Date: 2012-02-11 09:47 am (UTC)А книги получше есть на Флибусте, там хоть в них посторонних символов нет, народ следит, проверяет.