Подписаться на новости
  • Сенатор
  • ООО "Ай Вао"
  • Vitacoin

Будьте проще!

«Дежаргонизатор» сделает научный текст понятнее для широкой аудитории

Елизавета Ивтушок, N+1

Израильские ученые представили программу, которая автоматически определяет понятность научного текста. Их алгоритм De-Jargonizer разделяет слова на три группы по частотности и при помощи простой формулы рассчитывает, насколько текст может быть понятен широкой аудитории. Протестировав программу на статьях журнала PLoS, ученые выяснили, что аннотации некоторых статей могут содержать до 27 процентов редко встречающихся слов научной лексики. Статья с описанием работы программы доступна для прочтения в PLoS One, а опробовать алгоритм можно на сайте.

Проклятие знания (англ. curse of knowledge) – это одна из форм когнитивного искажения, при которой компетентный человек сталкивается со сложностями при попытке объяснить что-либо своему незнающему собеседнику, ввиду того, что он не может поставить себя на его место и представить себе, что этого можно не знать. Например, с этим когнитивным искажением могут столкнуться ученые, выпускающие статьи в рецензируемых журналах и читающие лекции: использование специфической лексики может привести к тому, что определенная тема останется непонятной для слушателей и читателей. Исследования показывают, что для того, чтобы понять текст, читатель должен быть знаком с 98 процентами всех встречающихся слов, в то время как естественнонаучные тексты и литература компьютерной тематики могут содержать около четверти слов специфичной научной лексики.

Авторы новой работы представили De-Jargonizer – программу, которая обрабатывает научный текст и дает автору информацию о проценте содержания слов специфичной лексики и редких слов, а также показатель (в форме очков) того, может ли взятый текст быть понятен широкой аудитории. Для этого исследователи создали большой (500 тысяч уникальных вхождений) корпус научных статей. Слова в таком корпусе были разделены на три группы: частотные (2000 самых часто встречающихся слов английского языка и их словообразовательных форм), редкие (слова меньшей частотности) и жаргонизмы (слова научной лексики).

De-Jargonizer.png

Пример работы алгоритма на аннотации (I) и кратком резюме (II) статьи из журнала PLOS. Желтым цветом выделены редкие слова, красным – слова научной лексики.

Алгоритм полностью рабочий, оснащен удобным интерфейсом и доступен для широкой публики. De-Jargonizer использует данный ему корпус для того, чтобы определить частотность каждого слова в тексте и отнести его к одной из трех групп (частотные, редкие или жаргонизмы) и вынести автору информацию о проценте содержания в его тексте слов каждого типа. На основании этого алгоритм затем определяет доступность текста для широкой аудитории и выдает сумму очков от 0 до 100.

Авторы проверили De-Jargonizer на 500 статьях из различных журналов издательства PLOS, специализирующегося на текстах различной научной тематики. Исследователи взяли аннотацию (abstract) и краткое резюме, написанное для широкой аудитории (lay summary). Результаты показали, что аннотации текстов по биологии содержат до 10 процентов слов специфичной лексики, в то время как резюме для широкой аудитории – около восьми процентов. Такой результат показывает, что, хотя и текст, написанный для широкой аудитории, содержит меньше научного жаргона, до понятности (текст должен содержать до двух процентов новой лексики, чтобы быть понятным) ему далеко.

Проблема проклятия знания является одним из самых распространенных недостатков академического письма. Автоматическое определение недостатков текста может помочь ученым избежать недопонимания при коммуникации с широкой, даже научной, аудиторией. Авторы планируют периодически обновлять корпус, используемый алгоритмом, а также включить в него другие языки.

Портал «Вечная молодость» http://vechnayamolodost.ru
 29.08.2017


Читать статьи по темам:

псевдонаука реклама Версия для печати
Ошибка в тексте?
Выдели ее и нажми ctrl + enter
назад

Читать также:

Следует ли бояться будущего?

Во Франции вышла книга «Трансгуманизм. Следует ли бояться будущего?», немедленно вызвавшая широкую полемику – от восторженных «за» до категорических «против».

читать

Счастье всем и даром

Чтобы смутные перспективы были совсем головокружительными, регулярно делаются сенсационные прогнозы о скором бессмертии, космическом туризме за несколько тысяч долларов и «смерти углеводородов через 15 лет».

читать

Популяризация науки – лучшее лекарство против мракобесия

Александр Соколов, создатель и редактор научно-просветительского портала «Антропогенез.ру», автор книги «Мифы об эволюции человека» – о том, как эффективно бороться с лженаучными теориями.

читать

Бабл-гам или наука?

Доказана эффективность жевательной резинки в борьбе с болезнетворными бактериями. Правда, читателей терзают смутные сомненья…

читать

Страшилка о пальмовом масле

Одна из типичных страшилок, которыми пользуются в корыстных целях, вновь была озвучена СМИ несколько недель назад. Нас стали пугать пальмовым маслом, которое якобы очень вредно и опасно.

читать