Януш. Хорошо, не буду начинать с определения массы. Я - химик-информатик, в последнее время даже появилось новое слово: химиоинформатик. Я защитил докторскую по химии, потому что в Польше оставалось окостенелое деление наук и не знали, как назвать область, к которой относится моя диссертация. Я должен был получить степень доктора химиоинформатики, или
информатики, которая служит решению химических проблем. Но такой области не существует. Было это на химическом факультете в Лодзи. Я не являюсь классическим, мокрым химиком. Я - - так называемый сухой химик. Я никогда не имел отношения к мензуркам, никогда не получал химических ожогов, потому что никогда не был в лаборатории. Для меня и для большинства моих коллег химия является записью молекул химических соединений, таких как бензол или этанол С2Н5ОН, в виде структур, которые можно представить на экране компьютера как графы. Наиболее популярно шестиатомное кольцо бензола. Ты помнишь три двойные связи? Для некоторых это так называемые улья. Каждая структура имеет свою формулу, каждая молекула, существующая на свете, включает нуклеиновые кислоты, которые входят в нашу ДНК и которых насчитывается три с половиной миллиарда.
Дорога. И ты их записываешь?
Януш. Эти структуры существуют, и люди знают, какие есть атомы, и какие связи, и как их можно нарисовать. Только не всегда рисунок является единственным решением. Зачастую не расскажешь о рисунке по телефону, поэтому ты должен присвоить этому рисунку некоторое название, но такое, чтобы, если это название услышал по телефону химик, он смог его нарисовать. Существуют определенные принципы создания названий этих структур, так называемая химическая номенклатура. Если ты кому-нибудь из химиков скажешь «ви-агра», тебя вряд ли поймут, потому что это название тривиальное (в данном случае маркетинговое), а не химическое. Точно так же, как никто не нарисует Дороту Веллман, услышав ее фамилию.
Дорога. Отчего же, два кружочка — и готово.
Януш (смеется). Может быть, ты действительно так думаешь, но ты очень ошибаешься. Любой химик, как и любой мужчина, видит тебя несколько иначе. Ты уникальна, и каждый, кто услышит твою фамилию, должен тебя нарисовать одинаково — в России, в Соединенных Штатах, в Германии или в Польше.
Дорота. И вы, господа, создали такую номенклатуру?
Януш. Эта номенклатура уже существовала, к сожалению, издавна. Если бы ее создали мы, то все было бы намного проще. А перевод этой структуры, заключенной в названии, является сложным процессом. Его устанавливают более шестисот различных правил, из которых имеется шестьдесят тысяч различных исключений. А эти названия необходимы, потому что никто не зарегистрирует нового лекарства или новой химической субстанции, если не пошлет название этой субстанции в РОА, то есть в Федеральное управление по контролю качества пищевых продуктов и лекарственных средств. И это должно быть правильное, систематическое химическое название. Его присваивают химики. Они сидят по восемь часов и называют эти структуры в соответствии с правилами номенклатуры. Смотрит такой химик на экран компьютера или на страничку, на которой нарисована структура, и говорит, что это, например, двуметилоаминофосфорин чего-то там. Посмотрел на структуру и записал название. Если у него хороший день, то он в состоянии отсмотреть примерно сто таких структур и присвоить им названия, а ведь некоторые из них занимают по три строчки, поскольку в них появляются разные заменители. Вероятность того, что он допустит ошибку в этих весьма сложных структурах, довольно велика. А кроме того, химики — обычные люди: то заболтаются, то на ланч отвлекутся, то жена или товарищ позвонят. А это все стоит денег. В моей фирме было семь химиков, и каждый зарабатывал сто тысяч марок в год, и, следовательно, моя фирма платила семьсот тысяч марок ежегодно этим семерым сотрудникам. Какое-то время спустя в фирме родилась мысль: а нельзя ли написать специальную программу, которая сама проанализирует эти структуры и присвоит им названия.
Дорота. И ты ее придумал?
Януш. Я ее написал.
Дорота. И лишил работы семерых химиков.
Януш. К сожалению. И поэтому меня не особенно любили в этой фирме. До меня никто подобной программы
не разрабатывал. Планировалось, что если мне не удастся написать в течение года такую программу, если не будет результатов, то со мной не продлят договора и тогда мне придется вернуться в Торунь, а мое начальство таким образом убедится, что написание данной программы невозможно или экономически невыгодно. Правил более шестисот, но самое трудное — это исключения, потому что тут появляются специфические названия и специфический язык. И как в любом языке, в нем имеются диалекты. Американцы говорят на чуточку ином химическом диалекте, чем европейцы. Я не могу изменить мир и заставить всех говорить на одном диалекте, а значит, это именно я должен приспособиться к их диалектам при создании разных названий для одной и той же структуры, которые в результате станут понятными и американцу, и европейцу. Это было непросто, но я такую программу написал.
Дорота. Первый в мире.
Януш. Первый в мире. На это у меня ушло четыре года.
Дорота. И она у тебя запатентована?
Януш. Я не мог ее запатентовать, это могла сделать только фирма, на которую я работал. Никто не может, не заплатив фирме, использовать данную программу. Если кто-то другой напишет, взяв за основу твою, программу лучшего качества, то не сможет запатентовать ее, так как нельзя запатентовать мысль. Но если кто-то создаст подобную программу, не зная о существовании твоей, то он имеет на нее право. И тогда дело будет обстоять так, как это происходит с операционными системами Арр1е и Ушс1очуз. Это две параллельные операционные системы — одна лучше, а другая хуже. Но тогда никто такой программы еще не создал — я был первым. Это позволило сэкономить огромные деньги. Тех семерых человек не уволили, их лишь перевели в другие отделы. Но двое из них должны были остаться, потому что программа неидеальна, у нее лишь определенный зиссезз гаЬе, то есть уровень успешности, так что человек пока еще должен контролировать предоставляемые программой результаты. В 80% случаев моя программа дает правильные названия; в течение одного дня химик обрабатывает сто структур, тогда как программа — четыреста тысяч.
Дорота. Хорошо. Ты уже создал эту программу, над чем работаешь сейчас?
Януш. Позже появилась новая проблема. Очень часто у нас есть название соединения, например прозак, виагра или ацетилсалициловая кислота, являющаяся активным компонентом в аспирине. И кто-то вписывает в интернетовском поисковике ацетилсалициловую кислоту, желая, чтобы на экране выскочила структура кислоты. Таким образом, он хочет чего-то обратного. Людям кажется, что это очень просто — заставить мою программу работать в обратном направлении. То есть если раньше в основе программы лежал переход от структуры к языку, то теперь это переход от языка к структуре. Вход в мою первую программу (от структур к названиям) вполне однозначен, поскольку во всем мире используется одна и та же структура, хотя названий может быть несколько. Стало быть, вход вполне определенный, но выход может быть разным в рамках этих разных химических диалектов. Во второй же программе вход неоднозначен, поскольку у одного и того же вещества может быть несколько названий или несколько вариантов написаний одного названия. Я же должен предусмотреть все это разнообразие вариантов и вывести для них одну-единственную структуру. Например, кто-то может писать «ацетило-салициловая кислота» через дефис, а кто-то другой без дефиса. И это проблема. И все же я такую программу написал. Для чего она нам нужна? Например, моя фирма ищет информацию о химических соединениях в профессиональной литературе, в которой информация содержится главным образом в патентах. В последнее время все меньше публикуют информацию о новых соединениях, а сразу их патентуют, ведь никогда не известно, не появится ли вслед за этим какая-нибудь новая программа, не скрываются ли за этим новые деньги. Так что лучше на всякий случай сразу запатентовать свое ноу-хау. Когда-то человек, сделавший какое-нибудь открытие, немедленно знакомил с ним