dedmazai_bg: (Default)
[personal profile] dedmazai_bg
Как вы наверное знаете, большинство книжек, которые размещены на электронных библиотеках, представляют собой отсканированные и склепанные файлы.

Насколько я понимаю, система переделывания бумажных книжек такова:
- Берут книгу и каждую ееную страничку сканируют
- Файлы множества страниц соединяют в один
- Полученный файл пропускают через специальную программу "Осере" OCR, которая графические картинки буковок распознает каким-то фотоаппаратным принципом и переводит в знакомые нам буквы формата "док".
- Полученный "док" проверяют грамматической исправлялкой и книжка готова!

Самому мне однажды на работе довелось присутствовать при создании такого файла. Коллега взяла какой-то журнал и принялась водить по строчкам ручной писюкающей машинкой. Та запоминала графику, а затем выдала на экране компьютера текст. Бля....лучше не буду объяснять, что там вышло. Буковки чуть ли не в каждом слове пришлось исправлять, так как машинка не видела разницы между "е" и "с". И не только...

А теперь о конкретном случае.
Не было у меня Интернета и вспомнил я о том, что где-то у меня валяется старинный, 2000-го года издания диск "Электронная библиотека". Несколько сот романов и прочих трудов человеческой мысли на русском языке.
Запустил я его, решив перечитать книжку Корецкого "Антикиллер". Она у меня и в бумажном варианте есть, но слишком мелкие буковки, лень напрягать глаза.

И вот читаю я, читаю...

Как всегда, одна и та же классическая ошибка - слово "мерс" (от мерседес) всюду МЕРЕ.

А затем натыкаюсь на пассаж и, прочитав его, чуть не падаю со смеху.

"Вещественным доказательством оказался отличающийся мощной светосилой
и повышенной разрешающей способностью компактный фотоаппарат "Минске" -
излюбленное средство всех разведок мира для пересъемки документов..."


и далее:

"...А когда Карнаухов получил рапорт подчиненного об обнаруженном у Га-
ленкова фотоаппарате "Минске" без пленки, вновь всплыла версия преда-
тельства..."


А теперь перенеситесь мысленно куда-нибудь в 2500-й год. Земная цивилизация давно разрушена, планета покинута, все заросло деревьями и травой, и лишь изредка из Космоса прилетают сюда инопланетные археологи - вести раскопки и изучать быт и культуру давно погибших людей.
И вот во время очередных раскопок на территории бывшей России они натыкаются ...о, чудо! на компакт-диск-библиотеку на русском языке! Какая невероятная находка!

Отвозят диск куда-нибудь к себе на Центавр или Альфу Кассиопеи и тамошние инопланетные археологи-русисты начинают материалы читать и изучать.

А затем пишут глубокомысленные труды:
"...В двадцатом веке на Земле исключительной популярностью у разведок пользовался фотоаппарат "Минске". Скорее всего, название этой всемирноизвестной в те времена марки фототехники происходит от белорусского города "Минск". Видимо на тамошнем секретном заводе и производился десятки лет сей высокоточный аппарат...".

А кто-нибудь может уже и сегодня, прочитав электронную версию "Антикиллера" так думает.

А на самом деле...
Откройте бумажный вариант. Никакого "Минске" или "Минск" не существует.
Программа "Осере" так прочитала и распознала незнакомое ей слово "МИНОКС". А человек, вычитывавший электронный вариант, или никогда о миноксах не слыхал, или вообще не обратил на странное слово внимание.
И сколько подобных ляпов бродит сейчас по Интернету...

Вот вам "Минокс". Его, кстати, с 1935 по 1943 годы производили и на ВЭФ в Риге, но отнюдь не в Минске...


Date: 2012-02-11 09:43 am (UTC)
From: [identity profile] su4ka-da.livejournal.com
купила планшет, поэтому читаю терь книги в электронном варианте в основном. это тихий ужас, конечно... постоянно какие-то посторонние символы, отсутствие пробелом между словами и т.д. реально проблема прямо.

Date: 2012-02-11 09:47 am (UTC)
From: [identity profile] dedmazai.livejournal.com
О, с покупкой!:-)
А книги получше есть на Флибусте, там хоть в них посторонних символов нет, народ следит, проверяет.

Profile

dedmazai_bg: (Default)
dedmazai_bg

January 2023

S M T W T F S
1234567
8 91011121314
15161718192021
22232425262728
293031    

Custom Text

Flag Counter

Style Credit

Expand Cut Tags

No cut tags
Page generated Mar. 22nd, 2026 07:45 pm
Powered by Dreamwidth Studios