Журналисту наш герой кажется родной душой — большая часть его профессиональной жизни связана с печатным словом. Программа FineReader, распознающая тексты на 189 языках, электронные словари Lingvo, помогающие переводить и изучать 20 иностранных языков, — все это создано командой ABBYY. Основатель компании Давид Ян рассказал «Итогам», откуда в нем такая тяга к лингвистике и чего стоит построить бизнес на языковом фундаменте.
— Давид, ваше увлечение лингвистикой из детства? Вы ведь росли в интернациональной семье.
— Действительно, моя мама — армянка, папа — китаец. Но важнее то, что оба они ученые, и уже с третьего класса я мечтал стать физиком, как они. Участвовал в олимпиадах и после физматшколы поступил в МФТИ. Мой научный шеф — Всеволод Феликсович Гантмахер, ныне академик РАН, работал в Институте физики твердого тела АН СССР в Черноголовке. Под его руководством я занимался исследованиями в области физики твердого тела. Но при этом хотелось ходить на дискотеки и купить джинсы и кроссовки. У родителей денег на это я не просил, вот и возникла идея заработать. А идея такая. Написать в июле программу — словарь,
— Тогда уже можно было продавать программы?
— Это был 1989 год. Шла перестройка, и организации уже
Нашел деньги — три тысячи рублей, по тому времени большие, годовая зарплата моего отца, профессора, и кооператив, который согласился перевести содержимое словаря с бумажного носителя на электронный, создать электронную словарную базу и предоставить нам права на публикацию.
Кооперативу в наследство от советских времен достались машинный зал с бобинами, на которых сохранялись данные, и операторы ввода — их было человек 30. Вся эта структура раньше входила в состав
Правда, они сами недооценили объем работ. Обязались все сделать до 1 сентября, а в реальности сдали работу только в апреле. У словаря ведь очень сложная структура. В отдельной инструкции было расписано, какими спецсимволами нужно помечать, скажем, авиационную промышленность. Более того, у клавиатур не было верхнего и нижнего регистров. Каждый раз, когда встречалась заглавная буква, она тоже помечалась спецзнаком. Это была эпохальная работа. Но в нашем с ними договоре была заложена неустойка на количество ошибок. Но не была оговорена максимальная сумма этой неустойки. И выяснилось, что ошибок у них столько, что вместо трех тысяч, которые мы должны были заплатить им, получилась неустойка на четыре тысячи. Руководитель кооператива умолял: люди работали девять месяцев, нужно им
— Заказчик тоже был счастлив?
— Мы запаковали дискеты и отправили к заказчику гонца. Это был Арам Пахчанян, мой одноклассник. У меня не было денег на билет до Еревана, а Арам как раз летел домой. А связи — никакой, мобильных телефонов еще не было. Только потом мы узнали, что он там пережил: приходит к заказчику, устанавливает систему, запускает программу, она спрашивает у него пароль, а мы в суматохе этот пароль сказать забыли. Вот сидит он, перед ним черный экран DOS и строка «введите пароль», а вокруг приемная комиссия заказчика, между прочим, большого серьезного НИИ в Ереване.
— И он выкрутился?
— Свершилось чудо! Мне кажется, физтехи могут все. Он ввел VELAKSOМ, и программа приняла этот пароль! Как он догадался, что Москалев задал в качестве пароля свою фамилию, написанную наоборот?! Но все получилось. НИИ перечислил деньги, даже не стал брать неустойку за девятимесячную задержку.
С задержками, проблемами программа Lingvo начала продаваться. Не за месяц, правда, а за год заработали 10 тысяч рублей. А к окончанию первого года обнаружили, что на рынке существует около 50 тысяч нелегальных копий нашей программы.
— Как это выяснили?
— Я взял телефонный справочник Академии наук, звонил в каждый институт и предлагал
— Каким образом?
— Объединили четыре программы, три из которых лицензировали у других производителей. Первая — программа сканирования. Вторая — корректор, проверяла орфографические ошибки после сканирования. Еще одна не наша программа делала подстрочник, и, наконец, четвертая — собственно Lingvo. С ее помощью можно было сделать нормальный перевод. Весь этот комплекс мы назвали Lingvo Systems, и он начал продаваться еще лучше. В разы. И стоил в разы дороже.
Однако вскоре мы поняли, что качество работы распознавалки текстов нас не устраивает. Константин Анисимович, один из авторов Lingvo, предложил сделать свою распознавалку. Первая реакция была: ты сошел с ума — целые научные школы занимаются этим десятки лет. Но он объяснил, как это сделать лучше: программу не надо будет учить каждому новому шрифту. Ведь тогда, прежде чем распознать, скажем, «Войну и мир», нужно первые десять страниц обработать в режиме обучения системы. Но если
И еще одна новинка, которую мы тогда реализовали: мы научились отличать русскую букву «р» от латинской буквы p, буквы «о» английские и русские, заглавные и строчные, а также цифру 0. Эти пять символов, хотя и выглядят одинаково, имеют совершенно разные коды для использования в компьютерных программах.
— Долго почивали на лаврах лучшей распознавалки?
— Это не совсем так. В первой версии мы уступали конкурентам по точности распознавания. Но зато она умела распознавать двуязычные тексты, и ее не надо было обучать. И в тот момент это оказалось важнее. К
— Давид, а что было в это время с учебой?
— Вся эта история началась на летних каникулах после четвертого курса. И пятый курс я проучился, почти не посещая институт. Мой шеф Гантмахер был очень недоволен. Он сказал: «Давид, вам надо определиться». Я пришел в деканат и попросил академический отпуск, обещая, что завершу за год историю с Lingvo и защищу диплом. Прозорливый декан сказал: «Вы за год ничего не закончите. Не надо себя обманывать. Мы вас отчислим, а когда завершите свои дела, приходите, восстановим». Он сдержал слово, меня отчислили в 1990 году. Через два года я понял, что появилось время для продолжения занятий в вузе, и вернулся в институт защитить диплом.
— По физике?
Журналисту наш герой кажется родной душой — большая часть его профессиональной жизни связана с печатным словом. Программа FineReader, распознающая тексты на 189 языках, электронные словари Lingvo, помогающие переводить и изучать 20 иностранных языков, — все это создано командой ABBYY. Основатель компании Давид Ян рассказал «Итогам», откуда в нем такая тяга к лингвистике и чего стоит построить бизнес на языковом фундаменте.
— Давид, ваше увлечение лингвистикой из детства? Вы ведь росли в интернациональной семье.
— Действительно, моя мама — армянка, папа — китаец. Но важнее то, что оба они ученые, и уже с третьего класса я мечтал стать физиком, как они. Участвовал в олимпиадах и после физматшколы поступил в МФТИ. Мой научный шеф — Всеволод Феликсович Гантмахер, ныне академик РАН, работал в Институте физики твердого тела АН СССР в Черноголовке. Под его руководством я занимался исследованиями в области физики твердого тела. Но при этом хотелось ходить на дискотеки и купить джинсы и кроссовки. У родителей денег на это я не просил, вот и возникла идея заработать. А идея такая. Написать в июле программу — словарь,
— Тогда уже можно было продавать программы?
— Это был 1989 год. Шла перестройка, и организации уже
Нашел деньги — три тысячи рублей, по тому времени большие, годовая зарплата моего отца, профессора, и кооператив, который согласился перевести содержимое словаря с бумажного носителя на электронный, создать электронную словарную базу и предоставить нам права на публикацию.
Кооперативу в наследство от советских времен достались машинный зал с бобинами, на которых сохранялись данные, и операторы ввода — их было человек 30. Вся эта структура раньше входила в состав
Правда, они сами недооценили объем работ. Обязались все сделать до 1 сентября, а в реальности сдали работу только в апреле. У словаря ведь очень сложная структура. В отдельной инструкции было расписано, какими спецсимволами нужно помечать, скажем, авиационную промышленность. Более того, у клавиатур не было верхнего и нижнего регистров. Каждый раз, когда встречалась заглавная буква, она тоже помечалась спецзнаком. Это была эпохальная работа. Но в нашем с ними договоре была заложена неустойка на количество ошибок. Но не была оговорена максимальная сумма этой неустойки. И выяснилось, что ошибок у них столько, что вместо трех тысяч, которые мы должны были заплатить им, получилась неустойка на четыре тысячи. Руководитель кооператива умолял: люди работали девять месяцев, нужно им
— Заказчик тоже был счастлив?
— Мы запаковали дискеты и отправили к заказчику гонца. Это был Арам Пахчанян, мой одноклассник. У меня не было денег на билет до Еревана, а Арам как раз летел домой. А связи — никакой, мобильных телефонов еще не было. Только потом мы узнали, что он там пережил: приходит к заказчику, устанавливает систему, запускает программу, она спрашивает у него пароль, а мы в суматохе этот пароль сказать забыли. Вот сидит он, перед ним черный экран DOS и строка «введите пароль», а вокруг приемная комиссия заказчика, между прочим, большого серьезного НИИ в Ереване.
— И он выкрутился?
— Свершилось чудо! Мне кажется, физтехи могут все. Он ввел VELAKSOМ, и программа приняла этот пароль! Как он догадался, что Москалев задал в качестве пароля свою фамилию, написанную наоборот?! Но все получилось. НИИ перечислил деньги, даже не стал брать неустойку за девятимесячную задержку.
С задержками, проблемами программа Lingvo начала продаваться. Не за месяц, правда, а за год заработали 10 тысяч рублей. А к окончанию первого года обнаружили, что на рынке существует около 50 тысяч нелегальных копий нашей программы.
— Как это выяснили?
— Я взял телефонный справочник Академии наук, звонил в каждый институт и предлагал
— Каким образом?
— Объединили четыре программы, три из которых лицензировали у других производителей. Первая — программа сканирования. Вторая — корректор, проверяла орфографические ошибки после сканирования. Еще одна не наша программа делала подстрочник, и, наконец, четвертая — собственно Lingvo. С ее помощью можно было сделать нормальный перевод. Весь этот комплекс мы назвали Lingvo Systems, и он начал продаваться еще лучше. В разы. И стоил в разы дороже.
Однако вскоре мы поняли, что качество работы распознавалки текстов нас не устраивает. Константин Анисимович, один из авторов Lingvo, предложил сделать свою распознавалку. Первая реакция была: ты сошел с ума — целые научные школы занимаются этим десятки лет. Но он объяснил, как это сделать лучше: программу не надо будет учить каждому новому шрифту. Ведь тогда, прежде чем распознать, скажем, «Войну и мир», нужно первые десять страниц обработать в режиме обучения системы. Но если
И еще одна новинка, которую мы тогда реализовали: мы научились отличать русскую букву «р» от латинской буквы p, буквы «о» английские и русские, заглавные и строчные, а также цифру 0. Эти пять символов, хотя и выглядят одинаково, имеют совершенно разные коды для использования в компьютерных программах.
— Долго почивали на лаврах лучшей распознавалки?
— Это не совсем так. В первой версии мы уступали конкурентам по точности распознавания. Но зато она умела распознавать двуязычные тексты, и ее не надо было обучать. И в тот момент это оказалось важнее. К
— Давид, а что было в это время с учебой?
— Вся эта история началась на летних каникулах после четвертого курса. И пятый курс я проучился, почти не посещая институт. Мой шеф Гантмахер был очень недоволен. Он сказал: «Давид, вам надо определиться». Я пришел в деканат и попросил академический отпуск, обещая, что завершу за год историю с Lingvo и защищу диплом. Прозорливый декан сказал: «Вы за год ничего не закончите. Не надо себя обманывать. Мы вас отчислим, а когда завершите свои дела, приходите, восстановим». Он сдержал слово, меня отчислили в 1990 году. Через два года я понял, что появилось время для продолжения занятий в вузе, и вернулся в институт защитить диплом.
— По физике?
Журналисту наш герой кажется родной душой — большая часть его профессиональной жизни связана с печатным словом. Программа FineReader, распознающая тексты на 189 языках, электронные словари Lingvo, помогающие переводить и изучать 20 иностранных языков, — все это создано командой ABBYY. Основатель компании Давид Ян рассказал «Итогам», откуда в нем такая тяга к лингвистике и чего стоит построить бизнес на языковом фундаменте.
— Давид, ваше увлечение лингвистикой из детства? Вы ведь росли в интернациональной семье.
— Действительно, моя мама — армянка, папа — китаец. Но важнее то, что оба они ученые, и уже с третьего класса я мечтал стать физиком, как они. Участвовал в олимпиадах и после физматшколы поступил в МФТИ. Мой научный шеф — Всеволод Феликсович Гантмахер, ныне академик РАН, работал в Институте физики твердого тела АН СССР в Черноголовке. Под его руководством я занимался исследованиями в области физики твердого тела. Но при этом хотелось ходить на дискотеки и купить джинсы и кроссовки. У родителей денег на это я не просил, вот и возникла идея заработать. А идея такая. Написать в июле программу — словарь,
— Тогда уже можно было продавать программы?
— Это был 1989 год. Шла перестройка, и организации уже
Нашел деньги — три тысячи рублей, по тому времени большие, годовая зарплата моего отца, профессора, и кооператив, который согласился перевести содержимое словаря с бумажного носителя на электронный, создать электронную словарную базу и предоставить нам права на публикацию.
Кооперативу в наследство от советских времен достались машинный зал с бобинами, на которых сохранялись данные, и операторы ввода — их было человек 30. Вся эта структура раньше входила в состав
Правда, они сами недооценили объем работ. Обязались все сделать до 1 сентября, а в реальности сдали работу только в апреле. У словаря ведь очень сложная структура. В отдельной инструкции было расписано, какими спецсимволами нужно помечать, скажем, авиационную промышленность. Более того, у клавиатур не было верхнего и нижнего регистров. Каждый раз, когда встречалась заглавная буква, она тоже помечалась спецзнаком. Это была эпохальная работа. Но в нашем с ними договоре была заложена неустойка на количество ошибок. Но не была оговорена максимальная сумма этой неустойки. И выяснилось, что ошибок у них столько, что вместо трех тысяч, которые мы должны были заплатить им, получилась неустойка на четыре тысячи. Руководитель кооператива умолял: люди работали девять месяцев, нужно им
— Заказчик тоже был счастлив?
— Мы запаковали дискеты и отправили к заказчику гонца. Это был Арам Пахчанян, мой одноклассник. У меня не было денег на билет до Еревана, а Арам как раз летел домой. А связи — никакой, мобильных телефонов еще не было. Только потом мы узнали, что он там пережил: приходит к заказчику, устанавливает систему, запускает программу, она спрашивает у него пароль, а мы в суматохе этот пароль сказать забыли. Вот сидит он, перед ним черный экран DOS и строка «введите пароль», а вокруг приемная комиссия заказчика, между прочим, большого серьезного НИИ в Ереване.
— И он выкрутился?
— Свершилось чудо! Мне кажется, физтехи могут все. Он ввел VELAKSOМ, и программа приняла этот пароль! Как он догадался, что Москалев задал в качестве пароля свою фамилию, написанную наоборот?! Но все получилось. НИИ перечислил деньги, даже не стал брать неустойку за девятимесячную задержку.
С задержками, проблемами программа Lingvo начала продаваться. Не за месяц, правда, а за год заработали 10 тысяч рублей. А к окончанию первого года обнаружили, что на рынке существует около 50 тысяч нелегальных копий нашей программы.
— Как это выяснили?
— Я взял телефонный справочник Академии наук, звонил в каждый институт и предлагал
— Каким образом?
— Объединили четыре программы, три из которых лицензировали у других производителей. Первая — программа сканирования. Вторая — корректор, проверяла орфографические ошибки после сканирования. Еще одна не наша программа делала подстрочник, и, наконец, четвертая — собственно Lingvo. С ее помощью можно было сделать нормальный перевод. Весь этот комплекс мы назвали Lingvo Systems, и он начал продаваться еще лучше. В разы. И стоил в разы дороже.
Однако вскоре мы поняли, что качество работы распознавалки текстов нас не устраивает. Константин Анисимович, один из авторов Lingvo, предложил сделать свою распознавалку. Первая реакция была: ты сошел с ума — целые научные школы занимаются этим десятки лет. Но он объяснил, как это сделать лучше: программу не надо будет учить каждому новому шрифту. Ведь тогда, прежде чем распознать, скажем, «Войну и мир», нужно первые десять страниц обработать в режиме обучения системы. Но если
И еще одна новинка, которую мы тогда реализовали: мы научились отличать русскую букву «р» от латинской буквы p, буквы «о» английские и русские, заглавные и строчные, а также цифру 0. Эти пять символов, хотя и выглядят одинаково, имеют совершенно разные коды для использования в компьютерных программах.
— Долго почивали на лаврах лучшей распознавалки?
— Это не совсем так. В первой версии мы уступали конкурентам по точности распознавания. Но зато она умела распознавать двуязычные тексты, и ее не надо было обучать. И в тот момент это оказалось важнее. К
— Давид, а что было в это время с учебой?
— Вся эта история началась на летних каникулах после четвертого курса. И пятый курс я проучился, почти не посещая институт. Мой шеф Гантмахер был очень недоволен. Он сказал: «Давид, вам надо определиться». Я пришел в деканат и попросил академический отпуск, обещая, что завершу за год историю с Lingvo и защищу диплом. Прозорливый декан сказал: «Вы за год ничего не закончите. Не надо себя обманывать. Мы вас отчислим, а когда завершите свои дела, приходите, восстановим». Он сдержал слово, меня отчислили в 1990 году. Через два года я понял, что появилось время для продолжения занятий в вузе, и вернулся в институт защитить диплом.