Круглосуточная трансляция из офиса Эргосоло

Трудности перевода

В проекте StartUp «Итоги» продолжают рассказ о самых успешных и харизматичных предпринимателях, начавших свой бизнес с нуля. Знакомьтесь: основатель компании ABBYY Давид Ян, который заставил компьютер прочесть «Войну и мир»

Журналисту наш герой кажется родной душой — большая часть его профессиональной жизни связана с печатным словом. Программа FineReader, распознающая тексты на 189 языках, электронные словари Lingvo, помогающие переводить и изучать 20 иностранных языков, — все это создано командой ABBYY. Основатель компании Давид Ян рассказал «Итогам», откуда в нем такая тяга к лингвистике и чего стоит построить бизнес на языковом фундаменте.

— Давид, ваше увлечение лингвистикой из детства? Вы ведь росли в интернациональной семье.

— Действительно, моя мама — армянка, папа — китаец. Но важнее то, что оба они ученые, и уже с третьего класса я мечтал стать физиком, как они. Участвовал в олимпиадах и после физматшколы поступил в МФТИ. Мой научный шеф — Всеволод Феликсович Гантмахер, ныне академик РАН, работал в Институте физики твердого тела АН СССР в Черноголовке. Под его руководством я занимался исследованиями в области физики твердого тела. Но при этом хотелось ходить на дискотеки и купить джинсы и кроссовки. У родителей денег на это я не просил, вот и возникла идея заработать. А идея такая. Написать в июле программу — словарь, англо-русский и русско-английский, в августе продать 100 экземпляров программы по 100 рублей каждый, заработать кучу денег и в сентябре вернуться к занятиям на пятом курсе.

— Тогда уже можно было продавать программы?

— Это был 1989 год. Шла перестройка, и организации уже что-то могли приобретать, правда, по безналу. В начале июля мне удалось найти программиста — Саша Москалев работал в соседнем институте в Черноголовке. Он подумал и сказал: я напишу программу, а ты будешь ее продавать. И еще я взял на себя задачу обеспечить словарную базу. Я сразу описал некий язык, с помощью которого нужно разметить текст словаря, чтобы программа могла автоматически вычленить заглавное слово, синонимы, антонимы, пометы и т. д. Впоследствии это получило название DSL (Dictionary Specification Language — язык спецификации словаря). Сейчас на нем ведется много различной работы, а тогда мы просто набросали страничку на бумаге, переписали от руки второй экземпляр и разошлись — каждый со своим листочком.

Нашел деньги — три тысячи рублей, по тому времени большие, годовая зарплата моего отца, профессора, и кооператив, который согласился перевести содержимое словаря с бумажного носителя на электронный, создать электронную словарную базу и предоставить нам права на публикацию.

Кооперативу в наследство от советских времен достались машинный зал с бобинами, на которых сохранялись данные, и операторы ввода — их было человек 30. Вся эта структура раньше входила в состав какого-то НИИ. Наборщики текстов работали вслепую — у них была только клавиатура. Но чтобы помнить, где они остановились в ходе работы, у каждого был мониторчик размером в один символ — с помощью курсора можно было прокрутить в этом окошке текст, вспомнить, в каком месте остановился, и продолжить набор.

Правда, они сами недооценили объем работ. Обязались все сделать до 1 сентября, а в реальности сдали работу только в апреле. У словаря ведь очень сложная структура. В отдельной инструкции было расписано, какими спецсимволами нужно помечать, скажем, авиационную промышленность. Более того, у клавиатур не было верхнего и нижнего регистров. Каждый раз, когда встречалась заглавная буква, она тоже помечалась спецзнаком. Это была эпохальная работа. Но в нашем с ними договоре была заложена неустойка на количество ошибок. Но не была оговорена максимальная сумма этой неустойки. И выяснилось, что ошибок у них столько, что вместо трех тысяч, которые мы должны были заплатить им, получилась неустойка на четыре тысячи. Руководитель кооператива умолял: люди работали девять месяцев, нужно им что-то заплатить. Я ему отвечал в том смысле, а что же делать нам. Сидели, препирались. А дело в том, что еще в августе прошлого года я уже продал, как собирался, этот словарь. Правда, не 100, а три экземпляра. Но не по 100, а по 700 рублей. И у нас уже был договор продажи на 2100 рублей. А продукта не было. Заказчик спрашивал: где словарь? Что делать? Мы с Сашей садимся и начинаем править базу сами. Вообще-то днем мне надо было учиться, а ему работать. Поэтому правили по ночам. И вот доходим до буквы «К», а ее нет нигде. Наборщики о ней то ли забыли, то ли схитрили, не знаю. А ведь в словаре это огромный объем! Что остается делать? Сели и начали вводить сами. Это было что-то ужасное! В конце концов загрузили в программу, и Lingvo начала переводить! Вводишь русское слово, она выдает английское, вводишь английское, получаешь в ответ русское. Счастье мы испытали бесконечное!

— Заказчик тоже был счастлив?

— Мы запаковали дискеты и отправили к заказчику гонца. Это был Арам Пахчанян, мой одноклассник. У меня не было денег на билет до Еревана, а Арам как раз летел домой. А связи — никакой, мобильных телефонов еще не было. Только потом мы узнали, что он там пережил: приходит к заказчику, устанавливает систему, запускает программу, она спрашивает у него пароль, а мы в суматохе этот пароль сказать забыли. Вот сидит он, перед ним черный экран DOS и строка «введите пароль», а вокруг приемная комиссия заказчика, между прочим, большого серьезного НИИ в Ереване.

— И он выкрутился?

— Свершилось чудо! Мне кажется, физтехи могут все. Он ввел VELAKSOМ, и программа приняла этот пароль! Как он догадался, что Москалев задал в качестве пароля свою фамилию, написанную наоборот?! Но все получилось. НИИ перечислил деньги, даже не стал брать неустойку за девятимесячную задержку.

С задержками, проблемами программа Lingvo начала продаваться. Не за месяц, правда, а за год заработали 10 тысяч рублей. А к окончанию первого года обнаружили, что на рынке существует около 50 тысяч нелегальных копий нашей программы.

— Как это выяснили?

— Я взял телефонный справочник Академии наук, звонил в каждый институт и предлагал программу-переводчик — словарь Lingvo за 700 рублей. Вначале меня слушали, а к концу первого бизнес-года в каждом третьем месте, куда мы звонили, отвечали, что у нас уже есть Lingvo и не надо нам говорить, что вы ее разработали. Украли, наверное, и пытаетесь продать. Нам, конечно, льстило, что программой уже пользуются… И еще мы поняли, что словарь словарем, а источник того, что надо переводить, — на бумаге. И человеку без знания английского языка достаточно сложно набрать на клавиатуре текст для перевода. Вот было бы здорово сделать всеобъемлющий продукт — от бумажного листа на одном языке до бумажного листа на другом языке! Скажем, вставляешь в сканер книжку на английском языке, нажимаешь несколько кнопок на компьютере, и из принтера выходит книга, распечатанная на русском. Это была мечта. Но мы попытались ее реализовать.

— Каким образом?

— Объединили четыре программы, три из которых лицензировали у других производителей. Первая — программа сканирования. Вторая — корректор, проверяла орфографические ошибки после сканирования. Еще одна не наша программа делала подстрочник, и, наконец, четвертая — собственно Lingvo. С ее помощью можно было сделать нормальный перевод. Весь этот комплекс мы назвали Lingvo Systems, и он начал продаваться еще лучше. В разы. И стоил в разы дороже.

Однако вскоре мы поняли, что качество работы распознавалки текстов нас не устраивает. Константин Анисимович, один из авторов Lingvo, предложил сделать свою распознавалку. Первая реакция была: ты сошел с ума — целые научные школы занимаются этим десятки лет. Но он объяснил, как это сделать лучше: программу не надо будет учить каждому новому шрифту. Ведь тогда, прежде чем распознать, скажем, «Войну и мир», нужно первые десять страниц обработать в режиме обучения системы. Но если где-то в середине встретится что-то напечатанное другим шрифтом, программа опять этого не поймет, вновь придется обучать. А наша будет понимать все шрифты сразу. И мы решили такую программу сделать. Начали проект в 1992 году, а в 1993-м выпустили первый продукт. И в первый день продали 40 коробок с ПО FineReader, а за первый месяц — 800! Это было просто немыслимо по тем временам.

Теперь-то у нас лучшие ученые в компании работают, и тот первый FineReader 1993 года не идет ни в какое сравнение с сегодняшним. Сегодня, если взять листок с текстом, программа его не просто распознает, но и сверстает в точно таком же виде в формате файла pdf с такими же картинками, такими же заголовками и т. д. Но в 1993 году это был прорыв.

И еще одна новинка, которую мы тогда реализовали: мы научились отличать русскую букву «р» от латинской буквы p, буквы «о» английские и русские, заглавные и строчные, а также цифру 0. Эти пять символов, хотя и выглядят одинаково, имеют совершенно разные коды для использования в компьютерных программах.

— Долго почивали на лаврах лучшей распознавалки?

— Это не совсем так. В первой версии мы уступали конкурентам по точности распознавания. Но зато она умела распознавать двуязычные тексты, и ее не надо было обучать. И в тот момент это оказалось важнее. К 1995–1997-м годам программа начала побеждать не только в России, но и в Америке, и в Европе на английских текстах. Тогда мы приняли решение о выходе на зарубежный рынок и ребрендинге компании. Мы стали называться ABBYY.

— Давид, а что было в это время с учебой?

— Вся эта история началась на летних каникулах после четвертого курса. И пятый курс я проучился, почти не посещая институт. Мой шеф Гантмахер был очень недоволен. Он сказал: «Давид, вам надо определиться». Я пришел в деканат и попросил академический отпуск, обещая, что завершу за год историю с Lingvo и защищу диплом. Прозорливый декан сказал: «Вы за год ничего не закончите. Не надо себя обманывать. Мы вас отчислим, а когда завершите свои дела, приходите, восстановим». Он сдержал слово, меня отчислили в 1990 году. Через два года я понял, что появилось время для продолжения занятий в вузе, и вернулся в институт защитить диплом.

— По физике?

Журналисту наш герой кажется родной душой — большая часть его профессиональной жизни связана с печатным словом. Программа FineReader, распознающая тексты на 189 языках, электронные словари Lingvo, помогающие переводить и изучать 20 иностранных языков, — все это создано командой ABBYY. Основатель компании Давид Ян рассказал «Итогам», откуда в нем такая тяга к лингвистике и чего стоит построить бизнес на языковом фундаменте.

— Давид, ваше увлечение лингвистикой из детства? Вы ведь росли в интернациональной семье.

— Действительно, моя мама — армянка, папа — китаец. Но важнее то, что оба они ученые, и уже с третьего класса я мечтал стать физиком, как они. Участвовал в олимпиадах и после физматшколы поступил в МФТИ. Мой научный шеф — Всеволод Феликсович Гантмахер, ныне академик РАН, работал в Институте физики твердого тела АН СССР в Черноголовке. Под его руководством я занимался исследованиями в области физики твердого тела. Но при этом хотелось ходить на дискотеки и купить джинсы и кроссовки. У родителей денег на это я не просил, вот и возникла идея заработать. А идея такая. Написать в июле программу — словарь, англо-русский и русско-английский, в августе продать 100 экземпляров программы по 100 рублей каждый, заработать кучу денег и в сентябре вернуться к занятиям на пятом курсе.

— Тогда уже можно было продавать программы?

— Это был 1989 год. Шла перестройка, и организации уже что-то могли приобретать, правда, по безналу. В начале июля мне удалось найти программиста — Саша Москалев работал в соседнем институте в Черноголовке. Он подумал и сказал: я напишу программу, а ты будешь ее продавать. И еще я взял на себя задачу обеспечить словарную базу. Я сразу описал некий язык, с помощью которого нужно разметить текст словаря, чтобы программа могла автоматически вычленить заглавное слово, синонимы, антонимы, пометы и т. д. Впоследствии это получило название DSL (Dictionary Specification Language — язык спецификации словаря). Сейчас на нем ведется много различной работы, а тогда мы просто набросали страничку на бумаге, переписали от руки второй экземпляр и разошлись — каждый со своим листочком.

Нашел деньги — три тысячи рублей, по тому времени большие, годовая зарплата моего отца, профессора, и кооператив, который согласился перевести содержимое словаря с бумажного носителя на электронный, создать электронную словарную базу и предоставить нам права на публикацию.

Кооперативу в наследство от советских времен достались машинный зал с бобинами, на которых сохранялись данные, и операторы ввода — их было человек 30. Вся эта структура раньше входила в состав какого-то НИИ. Наборщики текстов работали вслепую — у них была только клавиатура. Но чтобы помнить, где они остановились в ходе работы, у каждого был мониторчик размером в один символ — с помощью курсора можно было прокрутить в этом окошке текст, вспомнить, в каком месте остановился, и продолжить набор.

Правда, они сами недооценили объем работ. Обязались все сделать до 1 сентября, а в реальности сдали работу только в апреле. У словаря ведь очень сложная структура. В отдельной инструкции было расписано, какими спецсимволами нужно помечать, скажем, авиационную промышленность. Более того, у клавиатур не было верхнего и нижнего регистров. Каждый раз, когда встречалась заглавная буква, она тоже помечалась спецзнаком. Это была эпохальная работа. Но в нашем с ними договоре была заложена неустойка на количество ошибок. Но не была оговорена максимальная сумма этой неустойки. И выяснилось, что ошибок у них столько, что вместо трех тысяч, которые мы должны были заплатить им, получилась неустойка на четыре тысячи. Руководитель кооператива умолял: люди работали девять месяцев, нужно им что-то заплатить. Я ему отвечал в том смысле, а что же делать нам. Сидели, препирались. А дело в том, что еще в августе прошлого года я уже продал, как собирался, этот словарь. Правда, не 100, а три экземпляра. Но не по 100, а по 700 рублей. И у нас уже был договор продажи на 2100 рублей. А продукта не было. Заказчик спрашивал: где словарь? Что делать? Мы с Сашей садимся и начинаем править базу сами. Вообще-то днем мне надо было учиться, а ему работать. Поэтому правили по ночам. И вот доходим до буквы «К», а ее нет нигде. Наборщики о ней то ли забыли, то ли схитрили, не знаю. А ведь в словаре это огромный объем! Что остается делать? Сели и начали вводить сами. Это было что-то ужасное! В конце концов загрузили в программу, и Lingvo начала переводить! Вводишь русское слово, она выдает английское, вводишь английское, получаешь в ответ русское. Счастье мы испытали бесконечное!

— Заказчик тоже был счастлив?

— Мы запаковали дискеты и отправили к заказчику гонца. Это был Арам Пахчанян, мой одноклассник. У меня не было денег на билет до Еревана, а Арам как раз летел домой. А связи — никакой, мобильных телефонов еще не было. Только потом мы узнали, что он там пережил: приходит к заказчику, устанавливает систему, запускает программу, она спрашивает у него пароль, а мы в суматохе этот пароль сказать забыли. Вот сидит он, перед ним черный экран DOS и строка «введите пароль», а вокруг приемная комиссия заказчика, между прочим, большого серьезного НИИ в Ереване.

— И он выкрутился?

— Свершилось чудо! Мне кажется, физтехи могут все. Он ввел VELAKSOМ, и программа приняла этот пароль! Как он догадался, что Москалев задал в качестве пароля свою фамилию, написанную наоборот?! Но все получилось. НИИ перечислил деньги, даже не стал брать неустойку за девятимесячную задержку.

С задержками, проблемами программа Lingvo начала продаваться. Не за месяц, правда, а за год заработали 10 тысяч рублей. А к окончанию первого года обнаружили, что на рынке существует около 50 тысяч нелегальных копий нашей программы.

— Как это выяснили?

— Я взял телефонный справочник Академии наук, звонил в каждый институт и предлагал программу-переводчик — словарь Lingvo за 700 рублей. Вначале меня слушали, а к концу первого бизнес-года в каждом третьем месте, куда мы звонили, отвечали, что у нас уже есть Lingvo и не надо нам говорить, что вы ее разработали. Украли, наверное, и пытаетесь продать. Нам, конечно, льстило, что программой уже пользуются… И еще мы поняли, что словарь словарем, а источник того, что надо переводить, — на бумаге. И человеку без знания английского языка достаточно сложно набрать на клавиатуре текст для перевода. Вот было бы здорово сделать всеобъемлющий продукт — от бумажного листа на одном языке до бумажного листа на другом языке! Скажем, вставляешь в сканер книжку на английском языке, нажимаешь несколько кнопок на компьютере, и из принтера выходит книга, распечатанная на русском. Это была мечта. Но мы попытались ее реализовать.

— Каким образом?

— Объединили четыре программы, три из которых лицензировали у других производителей. Первая — программа сканирования. Вторая — корректор, проверяла орфографические ошибки после сканирования. Еще одна не наша программа делала подстрочник, и, наконец, четвертая — собственно Lingvo. С ее помощью можно было сделать нормальный перевод. Весь этот комплекс мы назвали Lingvo Systems, и он начал продаваться еще лучше. В разы. И стоил в разы дороже.

Однако вскоре мы поняли, что качество работы распознавалки текстов нас не устраивает. Константин Анисимович, один из авторов Lingvo, предложил сделать свою распознавалку. Первая реакция была: ты сошел с ума — целые научные школы занимаются этим десятки лет. Но он объяснил, как это сделать лучше: программу не надо будет учить каждому новому шрифту. Ведь тогда, прежде чем распознать, скажем, «Войну и мир», нужно первые десять страниц обработать в режиме обучения системы. Но если где-то в середине встретится что-то напечатанное другим шрифтом, программа опять этого не поймет, вновь придется обучать. А наша будет понимать все шрифты сразу. И мы решили такую программу сделать. Начали проект в 1992 году, а в 1993-м выпустили первый продукт. И в первый день продали 40 коробок с ПО FineReader, а за первый месяц — 800! Это было просто немыслимо по тем временам.

Теперь-то у нас лучшие ученые в компании работают, и тот первый FineReader 1993 года не идет ни в какое сравнение с сегодняшним. Сегодня, если взять листок с текстом, программа его не просто распознает, но и сверстает в точно таком же виде в формате файла pdf с такими же картинками, такими же заголовками и т. д. Но в 1993 году это был прорыв.

И еще одна новинка, которую мы тогда реализовали: мы научились отличать русскую букву «р» от латинской буквы p, буквы «о» английские и русские, заглавные и строчные, а также цифру 0. Эти пять символов, хотя и выглядят одинаково, имеют совершенно разные коды для использования в компьютерных программах.

— Долго почивали на лаврах лучшей распознавалки?

— Это не совсем так. В первой версии мы уступали конкурентам по точности распознавания. Но зато она умела распознавать двуязычные тексты, и ее не надо было обучать. И в тот момент это оказалось важнее. К 1995–1997-м годам программа начала побеждать не только в России, но и в Америке, и в Европе на английских текстах. Тогда мы приняли решение о выходе на зарубежный рынок и ребрендинге компании. Мы стали называться ABBYY.

— Давид, а что было в это время с учебой?

— Вся эта история началась на летних каникулах после четвертого курса. И пятый курс я проучился, почти не посещая институт. Мой шеф Гантмахер был очень недоволен. Он сказал: «Давид, вам надо определиться». Я пришел в деканат и попросил академический отпуск, обещая, что завершу за год историю с Lingvo и защищу диплом. Прозорливый декан сказал: «Вы за год ничего не закончите. Не надо себя обманывать. Мы вас отчислим, а когда завершите свои дела, приходите, восстановим». Он сдержал слово, меня отчислили в 1990 году. Через два года я понял, что появилось время для продолжения занятий в вузе, и вернулся в институт защитить диплом.

— По физике?

Журналисту наш герой кажется родной душой — большая часть его профессиональной жизни связана с печатным словом. Программа FineReader, распознающая тексты на 189 языках, электронные словари Lingvo, помогающие переводить и изучать 20 иностранных языков, — все это создано командой ABBYY. Основатель компании Давид Ян рассказал «Итогам», откуда в нем такая тяга к лингвистике и чего стоит построить бизнес на языковом фундаменте.

— Давид, ваше увлечение лингвистикой из детства? Вы ведь росли в интернациональной семье.

— Действительно, моя мама — армянка, папа — китаец. Но важнее то, что оба они ученые, и уже с третьего класса я мечтал стать физиком, как они. Участвовал в олимпиадах и после физматшколы поступил в МФТИ. Мой научный шеф — Всеволод Феликсович Гантмахер, ныне академик РАН, работал в Институте физики твердого тела АН СССР в Черноголовке. Под его руководством я занимался исследованиями в области физики твердого тела. Но при этом хотелось ходить на дискотеки и купить джинсы и кроссовки. У родителей денег на это я не просил, вот и возникла идея заработать. А идея такая. Написать в июле программу — словарь, англо-русский и русско-английский, в августе продать 100 экземпляров программы по 100 рублей каждый, заработать кучу денег и в сентябре вернуться к занятиям на пятом курсе.

— Тогда уже можно было продавать программы?

— Это был 1989 год. Шла перестройка, и организации уже что-то могли приобретать, правда, по безналу. В начале июля мне удалось найти программиста — Саша Москалев работал в соседнем институте в Черноголовке. Он подумал и сказал: я напишу программу, а ты будешь ее продавать. И еще я взял на себя задачу обеспечить словарную базу. Я сразу описал некий язык, с помощью которого нужно разметить текст словаря, чтобы программа могла автоматически вычленить заглавное слово, синонимы, антонимы, пометы и т. д. Впоследствии это получило название DSL (Dictionary Specification Language — язык спецификации словаря). Сейчас на нем ведется много различной работы, а тогда мы просто набросали страничку на бумаге, переписали от руки второй экземпляр и разошлись — каждый со своим листочком.

Нашел деньги — три тысячи рублей, по тому времени большие, годовая зарплата моего отца, профессора, и кооператив, который согласился перевести содержимое словаря с бумажного носителя на электронный, создать электронную словарную базу и предоставить нам права на публикацию.

Кооперативу в наследство от советских времен достались машинный зал с бобинами, на которых сохранялись данные, и операторы ввода — их было человек 30. Вся эта структура раньше входила в состав какого-то НИИ. Наборщики текстов работали вслепую — у них была только клавиатура. Но чтобы помнить, где они остановились в ходе работы, у каждого был мониторчик размером в один символ — с помощью курсора можно было прокрутить в этом окошке текст, вспомнить, в каком месте остановился, и продолжить набор.

Правда, они сами недооценили объем работ. Обязались все сделать до 1 сентября, а в реальности сдали работу только в апреле. У словаря ведь очень сложная структура. В отдельной инструкции было расписано, какими спецсимволами нужно помечать, скажем, авиационную промышленность. Более того, у клавиатур не было верхнего и нижнего регистров. Каждый раз, когда встречалась заглавная буква, она тоже помечалась спецзнаком. Это была эпохальная работа. Но в нашем с ними договоре была заложена неустойка на количество ошибок. Но не была оговорена максимальная сумма этой неустойки. И выяснилось, что ошибок у них столько, что вместо трех тысяч, которые мы должны были заплатить им, получилась неустойка на четыре тысячи. Руководитель кооператива умолял: люди работали девять месяцев, нужно им что-то заплатить. Я ему отвечал в том смысле, а что же делать нам. Сидели, препирались. А дело в том, что еще в августе прошлого года я уже продал, как собирался, этот словарь. Правда, не 100, а три экземпляра. Но не по 100, а по 700 рублей. И у нас уже был договор продажи на 2100 рублей. А продукта не было. Заказчик спрашивал: где словарь? Что делать? Мы с Сашей садимся и начинаем править базу сами. Вообще-то днем мне надо было учиться, а ему работать. Поэтому правили по ночам. И вот доходим до буквы «К», а ее нет нигде. Наборщики о ней то ли забыли, то ли схитрили, не знаю. А ведь в словаре это огромный объем! Что остается делать? Сели и начали вводить сами. Это было что-то ужасное! В конце концов загрузили в программу, и Lingvo начала переводить! Вводишь русское слово, она выдает английское, вводишь английское, получаешь в ответ русское. Счастье мы испытали бесконечное!

— Заказчик тоже был счастлив?

— Мы запаковали дискеты и отправили к заказчику гонца. Это был Арам Пахчанян, мой одноклассник. У меня не было денег на билет до Еревана, а Арам как раз летел домой. А связи — никакой, мобильных телефонов еще не было. Только потом мы узнали, что он там пережил: приходит к заказчику, устанавливает систему, запускает программу, она спрашивает у него пароль, а мы в суматохе этот пароль сказать забыли. Вот сидит он, перед ним черный экран DOS и строка «введите пароль», а вокруг приемная комиссия заказчика, между прочим, большого серьезного НИИ в Ереване.

— И он выкрутился?

— Свершилось чудо! Мне кажется, физтехи могут все. Он ввел VELAKSOМ, и программа приняла этот пароль! Как он догадался, что Москалев задал в качестве пароля свою фамилию, написанную наоборот?! Но все получилось. НИИ перечислил деньги, даже не стал брать неустойку за девятимесячную задержку.

С задержками, проблемами программа Lingvo начала продаваться. Не за месяц, правда, а за год заработали 10 тысяч рублей. А к окончанию первого года обнаружили, что на рынке существует около 50 тысяч нелегальных копий нашей программы.

— Как это выяснили?

— Я взял телефонный справочник Академии наук, звонил в каждый институт и предлагал программу-переводчик — словарь Lingvo за 700 рублей. Вначале меня слушали, а к концу первого бизнес-года в каждом третьем месте, куда мы звонили, отвечали, что у нас уже есть Lingvo и не надо нам говорить, что вы ее разработали. Украли, наверное, и пытаетесь продать. Нам, конечно, льстило, что программой уже пользуются… И еще мы поняли, что словарь словарем, а источник того, что надо переводить, — на бумаге. И человеку без знания английского языка достаточно сложно набрать на клавиатуре текст для перевода. Вот было бы здорово сделать всеобъемлющий продукт — от бумажного листа на одном языке до бумажного листа на другом языке! Скажем, вставляешь в сканер книжку на английском языке, нажимаешь несколько кнопок на компьютере, и из принтера выходит книга, распечатанная на русском. Это была мечта. Но мы попытались ее реализовать.

— Каким образом?

— Объединили четыре программы, три из которых лицензировали у других производителей. Первая — программа сканирования. Вторая — корректор, проверяла орфографические ошибки после сканирования. Еще одна не наша программа делала подстрочник, и, наконец, четвертая — собственно Lingvo. С ее помощью можно было сделать нормальный перевод. Весь этот комплекс мы назвали Lingvo Systems, и он начал продаваться еще лучше. В разы. И стоил в разы дороже.

Однако вскоре мы поняли, что качество работы распознавалки текстов нас не устраивает. Константин Анисимович, один из авторов Lingvo, предложил сделать свою распознавалку. Первая реакция была: ты сошел с ума — целые научные школы занимаются этим десятки лет. Но он объяснил, как это сделать лучше: программу не надо будет учить каждому новому шрифту. Ведь тогда, прежде чем распознать, скажем, «Войну и мир», нужно первые десять страниц обработать в режиме обучения системы. Но если где-то в середине встретится что-то напечатанное другим шрифтом, программа опять этого не поймет, вновь придется обучать. А наша будет понимать все шрифты сразу. И мы решили такую программу сделать. Начали проект в 1992 году, а в 1993-м выпустили первый продукт. И в первый день продали 40 коробок с ПО FineReader, а за первый месяц — 800! Это было просто немыслимо по тем временам.

Теперь-то у нас лучшие ученые в компании работают, и тот первый FineReader 1993 года не идет ни в какое сравнение с сегодняшним. Сегодня, если взять листок с текстом, программа его не просто распознает, но и сверстает в точно таком же виде в формате файла pdf с такими же картинками, такими же заголовками и т. д. Но в 1993 году это был прорыв.

И еще одна новинка, которую мы тогда реализовали: мы научились отличать русскую букву «р» от латинской буквы p, буквы «о» английские и русские, заглавные и строчные, а также цифру 0. Эти пять символов, хотя и выглядят одинаково, имеют совершенно разные коды для использования в компьютерных программах.

— Долго почивали на лаврах лучшей распознавалки?

— Это не совсем так. В первой версии мы уступали конкурентам по точности распознавания. Но зато она умела распознавать двуязычные тексты, и ее не надо было обучать. И в тот момент это оказалось важнее. К 1995–1997-м годам программа начала побеждать не только в России, но и в Америке, и в Европе на английских текстах. Тогда мы приняли решение о выходе на зарубежный рынок и ребрендинге компании. Мы стали называться ABBYY.

— Давид, а что было в это время с учебой?

— Вся эта история началась на летних каникулах после четвертого курса. И пятый курс я проучился, почти не посещая институт. Мой шеф Гантмахер был очень недоволен. Он сказал: «Давид, вам надо определиться». Я пришел в деканат и попросил академический отпуск, обещая, что завершу за год историю с Lingvo и защищу диплом. Прозорливый декан сказал: «Вы за год ничего не закончите. Не надо себя обманывать. Мы вас отчислим, а когда завершите свои дела, приходите, восстановим». Он сдержал слово, меня отчислили в 1990 году. Через два года я понял, что появилось время для продолжения занятий в вузе, и вернулся в институт защитить диплом.

838


Произошла ошибка :(

Уважаемый пользователь, произошла непредвиденная ошибка. Попробуйте перезагрузить страницу и повторить свои действия.

Если ошибка повторится, сообщите об этом в службу технической поддержки данного ресурса.

Спасибо!



Вы можете отправить нам сообщение об ошибке по электронной почте:

support@ergosolo.ru

Вы можете получить оперативную помощь, позвонив нам по телефону:

8 (495) 995-82-95