Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Авторы:

Жанры: Научная литература, Базы данных

Цикл: Наука XXI век

Формат: Полный

Всего в книге 66 страниц. Год издания книги - 2016.

Насколько велики на самом деле «большие данные» – огромные массивы информации, о которых так много говорят в последнее время? Вот наглядный пример: если выписать в линейку все цифры 0 и 1, из которых состоит один терабайт информации (вполне обычная емкость для современного жесткого диска), то цепочка цифр окажется в 50 раз длиннее, чем расстояние от Земли до Сатурна! И тем не менее, на «большие данные» вполне можно взглянуть в человеческом измерении. Эрец Эйден и Жан-Батист Мишель – лингвисты и компьютерные гении, создатели сервиса Google Ngram Viewer и термина «культуромика», показывают, каким образом анализ «больших данных» помогает исследовать трудные проблемы языка, культуры и истории.

Читать онлайн Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры


Моему папе, который всегда верил, что я умею считать

– ЭРЕЦ ЭЙДЕН —

Моей семье

– ЖАН-БАТИСТ МИШЕЛЬ —
* * *

Erez Aiden and Jean-Baptiste Michel

Uncharted: Big Data as a Lens on Human Culture


Дизайн обложки: студия OpenDesign

Печатается с разрешения авторов и литературного агентства Brockman, Inc.


Исключительные права на публикацию книги на русском языке принадлежат издательству AST Publishers. Любое использование материала данной книги, полностью или частично, без разрешения правообладателя запрещается.


Фото Эреца Эйдена © Eliza Grinnel

Фото Жана-Батиста Мишеля © Bret Hartman

© Erez Lieberman Aiden and Jean-Baptiste Michel, 2013

© Павел Миронов, перевод, 2014

© Издание на русском языке AST Publishers, 2016

Глава 1

Зазеркалье

Давайте представим, что у нас есть робот, способный прочитать каждую книгу на каждой полке всех крупных библиотек мира. Он может их прочесть невероятно быстро и запомнить каждое прочитанное слово в своей бесперебойно работающей памяти. Чему мы могли бы научиться у такого робота-историка?

Вот вам простой пример, знакомый каждому американцу. В наши дни принято говорить, что южные штаты полны (are full, множественное число) южан. Мы также говорим, что северные штаты полны (are full) северян или что штаты Новой Англии полны (are full) жителями. Однако мы говорим: the United States is full of citizens (то есть «США полон жителей», единственное число). Почему мы используем единственное число? Вопрос лежит не только в области грамматики – это, скорее, вопрос нашей национальной идентичности.

После основания Соединенных Штатов Америки основополагающий документ – Статьи Конфедерации – наделил центральное правительство слабыми полномочиями и описывал новое государство не как национальное объединение, а, скорее, как «дружеский союз» между отдельными государствами, чем-то напоминающий современный Европейский союз. Люди воспринимали себя не гражданами США, а гражданами определенного штата (государства).

И в этом смысле граждане говорили о Соединенных Штатах во множественном числе, что было вполне закономерно для союза различных и в целом независимых государств. Например, в обращении президента Джона Адамса 1799 года говорится о «Соединенных Штатах и их договорах с ее Британским Величеством» (курсив наш. – Э. Э. и Ж.-Б. М.). В наше время для президента США это совершенно немыслимо.

Когда же слова «Мы, народ…» (Конституция США, принятая в 1787 году) стали обозначать «одну нацию» (Клятва верности флагу, включенная в «Кодекс о флаге США» в 1942 году)? [1]

Если бы мы спросили об этом людей-историков, то, возможно, они бы указали нам на самый знаменитый ответ из финала знаменитой книги Джеймса Макферсона по истории гражданской войны – «Боевой клич свободы» [2]:

…Некоторые масштабные последствия войны кажутся очевидными. Были побеждены раскол и рабство, чтобы никогда не возникнуть вновь, даже через полтора столетия после Аппоматокса. Этот итог означал серьезную трансформацию американского общества и изменение государственного устройства, уточнившегося, если не сформировавшегося, в результате войны.

До 1861 года слова «Соединенные Штаты» чаще всего использовались как существительное во множественном числе: the United States are republic («Соединенные Штаты представляют собой республику»). Война привела к тому, что «Соединенные Штаты» стали в английском языке существительным в единственном числе.

Макферсон был не первым, кто выдвинул такое предположение; эта тема обсуждается уже не менее сотни лет. Стоит хотя бы вспомнить выдержку из статьи в газете Washington Post, опубликованной в 1887 году[3]:

Какое-то время, буквально несколько лет назад, о Соединенных Штатах говорилось во множественном числе. Было принято говорить: «Соединенные Штаты имеют» или «Соединенные Штаты являлись». Однако война все изменила. Вопрос грамматики был навсегда решен на линии огня от Чесапика до Сэбин-Пасс. Решение приняли не Уэллс, не Грин, не Линдли Мюррей, а сабли Шеридана, мушкеты Шермана и артиллерия Гранта… Поражение мистера Дэвиса и генерала Ли означало переход от множественного числа к единственному.

Даже через сто лет после того, как была написана эта потрясающая история о языке, артиллерии и приключениях, сложно сдержать волнение. Кто бы мог представить, что люди станут сражаться за грамматику или что «мушкеты Шермана» решат спор о тонкостях словоупотребления?

Но стоит ли этому верить?

Возможно. Джеймс Макферсон – бывший президент Американской исторической ассоциации и настоящая легенда среди историков. Его самая знаменитая работа «Боевой клич свободы» получила Пулитцеровскую премию. Более того, кто бы ни написал в 1887 году статью в Washington Post, Макферсон, вероятнее всего, сам испытал этот синтаксический переворот, и его свидетельству сложно не верить.

Тем не менее Джеймс Макферсон, каким бы великим он ни был, не непогрешим. А свидетели иногда неправильно интерпретируют факты. Можно ли с этим что-то сделать?

Возможно. Давайте предположим, что мы попросили нашего робота – гипотетического робота, прочитавшего все книги из всех библиотек, – поделиться с нами своим механистическим мнением.


С этой книгой читают
Сквозь зеркало языка
Автор: Гай Дойчер

Книга «Сквозь зеркало языка» – один из главных научно-популярных бестселлеров последних лет. Почему в некоторых культурах синий и зеленый цвета обозначаются одним и тем же словом? Почему Гомер называл море «виноцветным»? Почему коренные жители Австралии вместо «правый» и «левый» говорят «западный» и «восточный»? Как язык определяет образ жизни человека и судьбу народа? Остроумная и блестяще написанная книга одного из самых известных современных лингвистов – настоящий подарок для всех, кто интересуется жизнью языка и разнообразием человеческой культуры.


Электрошокеры - осторожно, злая собака!

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Крестоносцы, Они же татары

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Затаенное имя - Тайнопись в 'Слове о полку Игореве'

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Метод солнечных обращений
Автор: А Вольгюин

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


«Боевая стрельба из пистолета. Израильский стиль»

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Школьное образование и политика британских партий (1870–1997 гг.)

В монографии рассматривается проблема школьного образования в ходе реформ Консервативной, Либеральной и Лейбористской партий с 1870 г. по 1997 г. Охарактеризованы и систематизированы разные типы государственных школ, частных заведений и церковных школ разных конфессий. Повышенное внимание уделено инициативе британских церквей, и в первую очередь государственной Церкви Англии, создавшей основу начального обучения в Англии в XVIII в. и опекавшей специальные заведения для детей с ограниченными возможностями, а также благотворительные женские школы.


Повседневная жизнь России под звон колоколов
Жанр: История

Колокола и колокольчики для русского православного человека — не просто изделия из металла, это постоянные спутники жизни, от дня рождения до смертного часа.Автор книги, используя различные исторические источники (летописные сведения, описи монастырей и церквей, описания несохранившихся колоколов, надписи и орнаменты на тулове и т. д.), прослеживает историю бытования колоколов на Руси (а она обильна и героическими, и драматическими фактами и легендами), знакомит с «биографиями» некоторых знаменитых русских колоколов.


Пляска богов

Вампир Киан испытывает к принцессе Мойре чувства, которые до этого в нем не могла пробудить ни одна женщина за сотни лет — жгучую страсть в сочетании с отчаянной нежностью и желанием всячески опекать возлюбленную. Но не только эти двое из «круга шести» способны на яркие всепоглощающие эмоции. Между оборотнем Ларкиным и отважной женщиной-воином Блэр возникает взаимное влечение. Их поначалу невинный флирт постепенно превращается в нечто большее. И хотя они отдают себе отчет в том, что никогда не смогут принадлежать друг другу, противиться чувствам становится с каждым днем все труднее.


Любимые русские сказки

Сборник «Любимых русских сказок» от Animedia Company состоит из произведений «Волк и семеро маленьких козлят», «Курочка Ряба», «Три медведя» в пересказе Петра Полевого и Льва Толстого с великолепными красочными иллюстрациями Виктории Дунаевой.


Лена, Катя и Мылопуз Бессмертный

Действие этой озорной повести с почти шпионским сюжетом происходит в наши дни. Две любознательные подружки Катя и Лена неожиданно выдувают огромный мыльный пузырь, который, к их общему удивлению, не лопается. Девочки дают ему имя Мылопуз и прозвище Бессмертный и вместе с ним отправляются на его родину – в Мыльное королевство. Именно в этом королевстве, а также в соседнем, не очень дружелюбном Маникюрном, и произойдут все основные события, в которых активное участие примут главные герои сказки. Конфликт закручивается вокруг гениального изобретения главного мыловара Мыльного королевства профессора Геля – волшебного мыла, излечивающего от всех болезней.