Однако суть дата журнализма заключается не только в том, чтобы обрабатывать, анализировать и визуализировать данные ради данных и созданных на их основе ярких и насыщенных материалов. Цель состоит в выявлении правды, объяснении происходящих в социуме событий. Только при этом условии результатом становится качественная журналистика, продуктом которой являются профессиональные исследования/ расследования.
1.3 Модель коммуникации в журналистике данных
Коммуникация в журналистике данных носит двухсторонний характер и основывается на интерактивном взаимодействии с аудиторией. Определяющее значение имеет уровень вовлеченности пользователей, их участие в дискуссии и обратная связь. Именно поэтому в основе дата журнализма лежит циклическая (циркулярная) модель коммуникации.
Данная модель впервые была описана в трудах У. Шрамма и Ч. Осгуда в 1950-х годах. http://yanko.lib.ru/books/smi/osnovu_vozdeystviya_smi.pdf До этого коммуникация была представлена как линейный процесс (модель Г. Лассуэлла, Шеннона-Уивера).
У. Шрамм считал линейную модель некорректной, так как коммуникация — бесконечный процесс, в ходе которого отправитель и получатель в равной степени взаимодействуют друг с другом. В связи с этим он предложил циклическую модель, в рамках которой коммуникация представляла собой интерактивный процесс, позволяющий коммуникантам практически одновременно отправлять и получать сигналы. При этом и отправитель, и получатель выступают в качестве кодировщика, интерпретатора и дешифровщика сообщений, к которым они имеют совместный доступ.
Согласно данной модели, процесс коммуникации представляет собой диалог, где отправитель и получатель, обмениваясь сообщениями, поочередно меняются ролями. Кроме этого, важная роль отводится интерпретации сообщений. В связи с тем, что каждый коммуникант осуществляет дешифровку сообщений самостоятельно, может возникать «семантический шум», минимизировать который можно только посредством обратной связи.
Разумеется, в своем исходном виде данная модель не может применяться сегодня, так как за прошедший период времени общество претерпело значительные изменения. Прогресс науки и техники, развитие Интернета, процессы компьютеризации, цифровизации, диджитализации и конвергенции, усиление информационного потока, появление новых каналов передачи информации привели к трансформации медиа индустрии, а также изменили подходы к выстраиванию коммуникации.
Анекдот как коммуникация
... работы является положение о том, что анекдот – специфический речевой жанр, который реализует коммуникативную функцию. 1. Понятие процесса коммуникации, коммуникативные модели 1.1 Понятие процесса коммуникации Коммуникацию можно рассматривать как форму деятельности, осуществляемую людьми, которая ...
В связи с этим трансформируется и коммуникационная модель в журналистике, которая раньше носила строго иерархический характер, журналист всегда рассматривался как субъект, производящий уникальный материал, а аудитория являлась объектом, получающим контент в одностороннем порядке.
Говоря о журналистике данных, на сегодняшний момент в научной среде не выработано единой коммуникационной модели, однако практически все исследователи солидарны с тем, что она имеет циклический характер и во многом совпадает с моделью цифровой журналистики. В связи с этим автор предполагает, что коммуникационная модель в дата журнализме выглядит следующим образом:
Таким образом, в журналистике данных ключевые особенности модели, предложенной У. Шраммом и Г. Осгудом, остаются неизменными: определяющую роль играют интерактивное взаимодействие и обратная связь, однако появились и новые характеристики: модель становится субъект-субъектной и базируется на коллаборации производителей и потребителей контента. Кроме этого, значительно усложняется ее структура. Так, циклическая модель расширяется за счет увеличения числа неноминальных субъектов, принимающих участие в процессе создания медиаматериала, а также за счет новых инструментов кодировки, обработки, интерпретации и дешифровки сообщений и трансформации каналов его передачи, которые становятся исключительно цифровыми.
1.4 Отличие дата журнализма от схожих направлений журналистики
Активное развитие Интернета и цифровых технологий затронуло все сферы общественной жизни. Процесс компьютеризации, а также формирование сетевого общества обусловили изменение подходов к выстраиванию коммуникации с аудиторией. Трансформация информационно-коммуникационной модели характерна и для медийной сферы. Формируются новые медиаа: электронные СМИ, цифровое телевидение, которые теперь сосуществуют с традиционными (газеты, радио, телевидение), развиваются новые способы коммуникации, такие как социальные сети, блоги, электронная почта. Начинается процесс конвергенции средств массовой информации, обусловивший перераспределение ролей в традиционных СМИ, которые становятся децентрализованными, при этом существенно возрастает роль аудитории. Вартанова Е.Л. К чему ведет конвергенция СМИ? // Академия Google [электронный ресурс] URL: http://emag.iis.ru/arc/infosoc/emag.nsf/BPA/b59df6463a315de4c32568fd0038da32 (дата обращения 02.05.2017)
В конце XX века появляется понятие «интернет-журналистика», которая может быть определена как «качественно новый культурный и цивилизационный феномен, представляющий собой деятельность по формированию и представлению информационных образов актуальности, причем носителями этих образов могут быть не только слово, но и картинка, фотография, кино, видео, звук, веб-страница — любой объект, способный выступать в роли носителя информации или текста в широком смысле этого слова». Калмыков А.А., Кохан Л.А. Интернет-журналистика // Evartist. Авторский проект Екатерины Алеевой [электронный ресурс] URL: http://www.evartist.narod.ru/text16/025.htm (дата обращения: 02.05.2017) Развитие интернет-журналистики обусловило формирование новых направлений, таких как: real-time журналистика (журналистика «реального времени»), гражданская журналистика, мультимедийная и кросс-медийная журналистика (последние два понятия нередко используются как синонимы и могут быть обобщены термином «конвергентная журналистика») и др.
Социальная проблематика в отечественной журналистике
... социальной журналистики в России, выделить основные темы отечественной социальной журналистики, разработать цикл авторских программ социальной тематики, подготовить сценарии авторских программ на социальные темы, записать цикл авторских социальных передач. Объект исследования методы исследования Структура. 1. Социальная журналистика в ... актуальность исследования По данным Роскомнадзора, в 2014 году ...
К данному перечню также относится дата журнализм, имеющий схожие черты с конвергентной журналистикой. Дата журнализм также является конвергентным, однако понятие конвергентной журналистики намного шире: в нее входят все материалы, рассказывающие о событии в мультимедийном формате. В связи с этим необходимо определить критерии журналистики данных, позволяющие дифференцировать данное направление.
Можно выделить следующие общие черты дата журнализма и конвергентной журналистики:
1) интеграция коммуникативных и информационных технологий;
2) комбинирование аудио- и видеоматериалов с фотографиями, текстом и инфографикой при создании мультимедийных проектов;
3) основополагающим является принцип интерактивности;
4) распространение материалов осуществляется посредством цифровых каналов коммуникации;
5) высокие затраты временные и/ или материальные затраты.
Однако, как уже отмечалось в данной работе, ключевое отличие состоит в том, что центральное место в дата журналистском материале отводится работе с принципиально новым типом данных — big&open data, именно на основе их анализа и создается сюжет. К имманентным характеристикам, позволяющим дифференцировать этот тип данных от других, по мнению М.Г. Шилиной относятся: «отсутствие избирательности и точной выборки (полиизбирательность), вариабельность (поливариантность) использования, корреляционность выводов (полилогичность, полипричинность), что обусловливает полимерность и инновационность анализа данных и результатов». Шилина М.Г. Визуализация как императив коммуникации в парадигме big data? // Визуальная коммуникация в современной динамике. Сборник статей II Международной научной конференции. Казанский федеральный университет [электронный ресурс] URL: http://kpfu.ru/portal/docs/F1430240637/sbornik.itogovyj.PDF (дата обращения: 01.05.2017) При создании медиатекста, не относящегося к дата журнализму, также могут использоваться данные, однако их объем намного меньше, они не анализируются, а берутся уже в готовом виде из различных исследований для создании инфографики.
Журналистика данных предусматривает работу исключительно с оцифрованным массивом необработанных данных, которые рядовой пользователь без предварительной подготовки не способен проинтерпретировать. Создание дата журналистских проектов предполагает более сложный уровень аналитики и визуализации, так как нередко уже обработанные и проинтерпретированные данные невозможно воспринимать без визуального сопровождения. Чем качественнее выполнена визуализация данных, тем легче журналисту взаимодействовать с аудиторией и доносить до нее ключевые идеи.
Важно отметить, что для журналистики данных принципиально важное значение имеет обратная связь и вовлеченность пользователей в дискуссию. За счет этого журналист получает возможность вступать в прямую открытую онлайн коммуникацию с аудиторией. К обсуждению нередко привлекаются специалисты из разных областей, которые дают экспертную оценку опубликованному медиатексту, а также добавляют свои замечания и предложения.
Методические рекомендации по подготовке и защите выпускных квалификационных ...
... основ работы и методов исследования. Актуальность темы ВКР — степень её важности в данный момент и в данной ... журналистики, так и квалифицированный специалист соответствующей сферы журналистики. подача студентом заявления с просьбой разрешить выполнять ВКР по ... основе полученных в исследовании данных. Цель работы — это то, что необходимо получить при проведении исследования, некоторый образ будущего. ...
Как правило, дата журналистский материал сопровождается ссылкой на исходные базы «сырых данных», задействованные при подготовке статьи, что повышает уровень доверия к предоставляемому контенту. Имея доступ к данным, пользователи могут не только потреблять, но и создавать собственный контент (просьюмеризм), добавлять его к опубликованной в издании статье или расширять базу данных за счет присоединения своих наборов данных, повышая при этом информационную ценность имеющегося материала. То есть пользователи, принимая активное участие в создании материала, становятся соавторами, полноценными субъектами коммуникации и формируют повестку дня, за счет этого площадка интернет-издания превращается в общественную платформу, предназначенную для обсуждения важных событий, проблем и явлений социальной жизни. Все это свидетельствует о том, что посредством вовлечения аудитории в коммуникацию происходит развитие социальных медиа.
Таким образом, специфика дата журнализма заключается в том, что журналист при создании медиатекста использует данные как основной ресурс формирования темы, сюжета, креативной концепции и выбора способов визуализации, а также как ключевой инструмент, позволяющий вовлекать аудиторию в процесс коммуникации и развивать социально-значимые темы.
Выводы по главе:
Дата журнализм — направление современной журналистики, в основе которого лежит фильтрация и анализ больших наборов данных с целью создания интересного сюжета. Предпосылки формирования журналистики данных возникли в XX веке, однако ключевым фактором развития данного направления является появление доступа к большим и открытым данным, а также инструментов с открытым исходным кодом, позволяющих анализировать эти данные.
Журналистика данных — трудоемкий процесс, требующий значительных усилий, временных и материальных затрат, а также слаженной работы целой команды профессионалов.
Дата журнализм позволяет исследовать социально значимые явления и процессы, помогает людям лучше понимать закономерности жизни общества, а также привлекает их внимание к значимым общественным проблемам.
В рамках данной работы хотелось бы затронуть еще один момент. Сейчас многие зарубежных СМИ внедряют в процесс своей работы автоматизированные системы: роботы уже давно формируют повестку дня, являются авторами стихотворений и даже пишут картины с помощью нейросетей. Подобные явления провоцируют активное обсуждение того, что в будущем роботы смогут заменить журналистов, особенно тех, кто работает с данными. Однако ключевое отличие дата журнализма от машинной журналистики заключается в наличии автора со сформированной базой ценностей. У робота отсутствует социальная ответственность и личная социальная позиция (есть только та, которую закладывают другие люди, нередко в своих интересах), именно поэтому он никогда не сможет заменить живого человека.
Робот может создать материал, но он не способен найти темы, которые будут социально значимыми, потому что журналист — человек, который ищет социальную ответственность в своей работе
Роль журналиста состоит в поддержании информационного порядка в обществе. Журналистике всегда будут нужны люди, которые хотят помочь обществу и способны говорить правду, а это возможно только при наличии этической установки, социальной позиции и сформированной системы ценностей.
Лингвистические особенности английских и русских медиатекстов
... другими языками) произошли заметные изменения. Целью данной научной работы является выявление лингвистических особенностей английских и русских медиатекстов. Для достижения указанной цели ставятся следующие задачи ... историческое развитие, нынешнее состояние и особенности деятельности средств массовой коммуникации. По сравнению с традиционной интерпретацией текста, в которой ряд словесных символов ...
Глава 2. Медиатекст в современном коммуникативном пространстве
2.1 Медиатекст: понятие и особенности
В данной работе уже говорилось о трех важных процессах конца XX — начала XXI века, значительно повлиявших на развитие общества. Глобализация, конвергенция и диджитализация способствовали формированию совершенно иного типа общества — сетевого, обусловили трансформацию информационно-коммуникационной сферы и во многом определили принципы функционирования современных средств массовой информации. СМИ становятся интерактивными и многоканальными, переводят свое содержание в цифровой формат, происходит слияние разных типов СМИ в рамках единой редакции, появляются технологии, позволяющие транслировать информацию пользователям с использованием разных технических носителей: кабельных, телефонных, беспроводных сетей, изменяется модель коммуникации с аудиторией, то есть происходит технологическая трансформация СМИ. Развитие медиаиндустрии приводит к видоизменению информационного продукта, который теперь становится мультимедийным.
По мнению Т.Г. Добросклонской, в условиях становления информационного общества появляется необходимость изучения «основной дискретной единицы медиапотока» — медиатекста, «рамки которого позволяют объединить такие разноплановые и многоуровневые понятия, как газетная статья, радиопередача, телевизионные новости, интернет-реклама и прочие виды продукции средств массовой информации». Добросклонская Т.Г. Медиалингвистика: системный подход к изучению языка СМИ // Московский государственный университет имени М.В. Ломоносова [электронный ресурс] URL: http://www.ffl.msu.ru/research/publications/dobrosklonskaya/dobrosklonskaya-medialingvistika.pdf (дата обращения: 04.05.2017)
Термин «медиатекст» появился в работах зарубежных авторов, таких как А. Белл, Р. Фоулер, М. Монтгомери, в конце XX века, и быстро закрепился в международных научных кругах в связи с возрастанием интереса к особенностям языка в области массовых коммуникаций. Изучение медиатекста является предметом научного интереса многих современных исследователей, среди которых Т.Г. Добровольская, М.В. Луканина, М.А. Пильгун, Г.Я. Солганик, М.Г. Шилина, Д.Н. Шмелёв и другие. Однако классического, разделяемого всем научным сообществом определения медиатекста не существует. В связи с этим рассмотрим дифиниции, предложенные некоторыми российскими и зарубежными исследователями.
А. Белл в работе «Approaches to Media Discourse» охарактеризовал медиатекст следующим образом: определение медиатекста кардинальным образом отличается от традиционного взгляда на текст, как на совокупность написанных на бумаге слов, оно намного шире и включает в себя такие элементы, как речь, музыка, звуковые эффекты, иллюстрации. То есть понятие медиатекста отражает технологии, задействованные в процессе его производства. Dobrosklonskaya T. G. Media Linguistics: theory and methods of studying language in the media // Медиалингвистика. Международный научный журнал. — 2014. — №2(5).
URL: http://medialing.spbu.ru/upload/files/file_1419031673_9233.pdf (дата обращения: 03.05.2017)
Настольные системы управления базами данных
... числовыми данными, выполнив консолидацию по расположению данных. По данным таблицы на рис.22.3 построить гистограмму. формировать выходной документ. Характеристика ПК и программного обеспечения, использованных для выполнения и оформления данной курсовой работы: процессор Celeron ...
М.А. Пильгун определяет медиатекст, как «синкретическое единство вербальных и невербальных компонентов, обладающее связностью и цельностью, имеющее определенную направленность и прагматическую установку». Пильгун М.А. Мультимедийный текст: особенности функционирования и перспективы развития // Cyberleninka. — 2015. — Т.157. — № 5. URL: http://cyberleninka.ru/article/n/multimediynyy-tekst-osobennosti-funktsionirovaniya-i-perspektivy-razvitiya (дата обращения: 30.04.2017)
М.Ю. Казак дефиницирует медиатекст как «интегративный многоуровневый знак, объединяющий в единое коммуникативное целое разные семиотические коды (вербальные, невербальные, медийные) и демонстрирующий принципиальную открытость текста на содержательно-смысловом, композиционно-структурном и знаковом уровнях». Казак М.Ю. Специфика современного медиатекста // Современный дискурс-анализ. Научный журнал [электронный ресурс] URL: http://discourseanalysis.org/ada6/st42.shtml (дата обращения: 02.05.2017)
С точки зрения, М.Г. Шилиной «в интернете любой текст, контент может быть охарактеризован как медиатекст, медиаконтент, априорно доступный для потребления и изменения глобальной массовой аудиторией». Шилина М.Г. Медиатекст в Интернете: теоретико-методологические подходы к исследованию // СКФУ [электронный ресурс] URL: (03.05.2017)
медиатекст
характеристикам
Направленность на массовую аудиторию
2) Медийный характер
В основе медиатекста лежит комбинирование информации, представленной в разных формах: текстовой, графической, звуковой. Наиболее ярко данная характеристика проявляется на примере интернет-медиатекстов.
Опосредованность коммуникации
4) Коллективное производство
Процесс создания медиатекста предусматривает работу нескольких профессионалов: журналиста, редактора и других. Как правило, медиатекст публикуются от лица издания, однако иногда присутствует прямое указание на автора.
Открытость, смысловая незавершенность,, Членение на составляющие
Медиатекст, как правило, разбивается на блоки с подзаголовками, состоящие из небольших абзацев, для облегчения его восприятия аудиторией.
Поликодовость, креализованный характер текста
Медиатекст строится на сочетании разных знаковых систем: вербальные компоненты комбинируются с невербальными, визуальными.
Интертекстуальность
Медиатекст является частью единого коммуникационного пространства, связан с другими текстами и содержит явные или неявные отсылки к ним.
9) «Вторичность» информации
Содержание медиатекста представляет собой совокупность переработанной, систематизированной, сокращенной информации текстов-первоисточников.
Обозначенные характеристики являются универсальными и присущи любому медийному тексту. Однако существуют и другие особенности, которые варьируются для разных типов медиатекстов и зависят от того, посредством каких каналов они распространяются.
В рамках данной работы интерес представляют характеристики сетевого медиатекста, функционирующего в Интернете и онлайн-СМИ, среди которых можно выделить следующие:
Гипертекстуальность
Гипертекст — «набор компьютерных текстов в интернете, содержащих узлы перехода между ними, которые позволяют избирать читаемые сведения или последовательность чтения». Шилина М.Г. Медиатекст в Интернете: теоретико-методологические подходы к исследованию // СКФУ [электронный ресурс] URL: (03.05.2017)
Проектирование и разработка реляционной базы данных для информационной ...
... хранению и анализу информации. Целью данной курсовой работы является создание реляционной базы данных зоомагазина и разработка приложения для работы с данной базой. В совокупности данная ... рыбы»: Атрибуты: Вид рыбы. Сущность - «Возврат»: Атрибуты: Причина, Дата возврата. Сущность - «Гарантия»: Атрибуты: Дата окончания, Примечания, Дата начала. Сущность - «Должности»: Атрибуты: Должность. Сущность - « ...
Данная характеристика дает пользователям возможность, изучая один материал, охватывать множество других, как правило, связанных между собой текстов, переходя по ссылкам от одного к другому.
Сжатость и краткость текста
Web-текст должен быть небольшим по объему и хорошо структурированным, так как в условиях информационной перегруженности и нехватки времени пользователи не способны воспринимать чересчур насыщенные тексты.
Точность заголовков, Наличие рекламы
Сетевой текст нередко сопровождается обилием контекстной рекламы в виде обрамления или всплывающих окон, которая может затруднять восприятие материала пользователями.
Интерактивный характер
6) Важность обратной связи
В отличие от материалов, распространяемых в печатных СМИ или по телевидению, медиатекст в Интернете предполагает двухсторонний характер коммуникации. Возрастает роль обратной связи с аудиторией. У пользователей появляется возможность прокомментировать прочитанный материал, оценить его, поделится своим мнением. Данная опция значительно повышает эффективность коммуникации журналиста с читателями.
2.2 Типология медиатекстов
На данный момент существует ряд критериев, выработанных различными исследователями, И.В. Рогозина, Н.А, Кузнецова, Г.В. Лазутина, Г.Я. Солганик, Г.С. Мельники и другие на основании которых осуществляется типологизация медиатекстов.
В рамках данной работы автор предлагает рассмотреть классификацию медиатекстов, предложенную доктором филологических наук Т.Г. Добросклонской в книге «Медиалингвистика: системный подход к изучению языка СМИ». Добросклонская Т.Г. Медиалингвистика: системный подход к изучению языка СМИ // Московский государственный университет имени М.В. Ломоносова [электронный ресурс] URL: http://www.ffl.msu.ru/research/publications/dobrosklonskaya/dobrosklonskaya-medialingvistika.pdf (дата обращения: 04.05.2017) Т.Г. Добросклонская выделяет совокупность параметров, позволяющих охарактеризовать любой медиатекст с точки зрения лингво-форматных признаков, особенностей его разработки и каналов распространения. К ключевым параметрам относятся:
Ш Способ производства
1) Авторский
Такой медиатекст обязательно содержит указание на автора работы. Сюда относятся репортажи корреспондентов, материал обозревателя и др.
2) Коллегиальный
Создается группой разработчиков и, как правило, распространяется от корпоративного лица изданий и информационных агентств: новостные материалы ТАСС, The Guardian, BBС и других.
Ш Форма
1) Вербальная
2) Невербальная (например, фотография)
3) Вербально-невербальная
Примером смешанного типа является креолизованный текст (поликодовый, видеовербальный) — текст, «фактура которого состоит из двух негомогенных частей: вербальной и невербальной, принадлежащей к другим знаковым системам, нежели естественный язык». Ворошилова М.Б. Креолизованный текст: аспекты изучени // Политическая лингвистика. — 2006. -Вып.20. URL: http://www.philology.ru/linguistics2/voroshilova-06.htm (дата обращения: 03.05.2017) То есть это текст, в основе которого лежит объединение средств нескольких различных семиотических систем: вербальной и иконической. Например, материал, в котором письменный текст сопровождается графическими средствами. На сегодняшний день самым распространенным является именно креолизованный медиатекст.
Депонируемые материалы идентифицирующие программу для эвм или ...
... менее 2,1 мм. 2.Требования к оформлению депонируемых материалов Депонируемые материалы, включая реферат, должны обеспечивать однозначную идентификацию регистрируемой программы для ЭВМ или базы данных. Депонируемые материалы, идентифицирующие программу для ЭВМ, представляются в форме исходного текста (полного или фрагментов) или иной форме, присущей языку программирования, на ...
Каналы распространения
Средства массовой информации, в рамках которых публикуется и функционирует медиатекст. В качестве канала распространения может выступать телевидение, радио, печать, Интернет.
Выбор канала распространения определяет медийные свойства медиатекста, а также форму его представления. Так, телевизионный медиатекст представляет собой непрерывный высокоскоростной информационный поток, сопровождающийся текстом, аудио- и видеорядом. Для улучшения восприятия содержания текста в печатных СМИ особое внимание уделяется графике и иллюстрациям. При распространении посредством Интернета особое внимание также уделяется графическому оформлению и визуализации, которая может быть, как статической, так и динамической.
Кроме этого, специфика интернет-медиатекста определяется характеристиками, присущими интернет-коммуникации, такими как интерактивность, конвергентность, дигитальность, модульность, за счет которой в едином смысловом пространстве осуществляется комбинирование разнородных элементов.
Функционально-жанровый тип текста
1) Информационные/информационно-новостные медиатексты: репортаж, интервью, хроника, отчет и др.
2) Аналитические: обзор, рецензия, статья
3) Художественно-публицистические: фельетон, очерк, памфлет
4) Рекламные
Важно отметить, что данная классификация является обобщенной, и не может охватить всего жанрового разнообразия современных медиатекстов. К тому же, в связи с процессом конвергенции СМИ появляются новые интегрированные жанры: инфотейнмент, эдьютейнмент и другие. Луканина М.В. Текст средств массовой информации и конвергенция // Политическая лингвистика. -2006. — Вып.20. URL: http://www.philology.ru/linguistics2/lukanina-06.htm (дата обращения: 30.04.2017)
Тематическая доминанта
Содержательная характеристика текста, позволяющая выявить его принадлежность к определенному «медиатопику» — одной из тем, которая регулярно освещается в СМИ: политика, спорт, культура, экономика, бизнес и другие.
Описанная классификация медиатекстов является одним из вариантов многочисленных типологий, предложенных в научной среде. Однако общепринятая классификация медиатекстов еще не выработана. Отсутствие классической типологизации объясняется свойствами медийного материала, а также невозможностью определения базовых категорий, позволяющих охватить все многообразие существующих медиатекстов. Казак М.Ю. Специфика современного медиатекста // Современный дискурс-анализ. Научный журнал [электронный ресурс] URL: http://discourseanalysis.org/ada6/st42.shtml (дата обращения: 02.05.2017)
2.3 Технологический цикл создания медиатекста в журналистике данных
Создание медиатекста, базирующегося на данных, — трудоемкий процесс, предполагающий скоординированную деятельность целой команды профессионалов. От качества выполнения работы на каждом этапе разработки медиатекста зависит конечный результат.
Классификация баз данных и их основные характеристики
... операционной среды и специальные механизмы обращения СУБД к данным. 2. Классификация баз данных Классификация по модели данных: 1. Иерархическая 2. Объектная и объектно-ориентированная 3. ... исключения). Существует огромное количество разновидностей баз данных, отличающихся по разным критериям. Например, в «Энциклопедии технологий баз данных», по материалам которой написан данный раздел, определяются ...
Stray J. How The Guardian is pioneering data journalism with free tools // NiemanLab [
1. Сбор данных
На данном этапе формируется идея будущего материала, его креативная концепция, а также происходит сбор данных, удовлетворяющих выбранной тематике. Данные могут быть получены несколькими способами:
- Ш непосредственно из правительственных, научных и других баз данных, таких как data.gov, data.gov.uk и API Data Всемирного банка, а также путем подачи запросов в правительственные учреждения и организации о получении доступа к данным;
— Ш посредством парсинга англ. Web scraping, метод получения контента посредством специально обученных алгоритмов веб-сайтов с помощью таких инструментов, как ScraperWiki, OutWitHub, Import.io и других. Для получения данных из PDF-файлов может быть использована программа оптического распознавания символов OCR-Software.
Ш путем самостоятельного сбора данных посредством наблюдений, опросов, онлайн-форм или краудсорсинга.
2. Фильтрация и обработка данных
Чтобы получить качественный материал для дальнейшей работы собранные данные необходимо очистить (отфильтровать).
Как правило, фильтрация происходит двумя способами: устранение человеческой ошибки и преобразования данных в формат, совместимый с другими данными, которые используются. Так, сформированные на первом этапе наборы данных, могут содержать следующие ошибки: повторяющиеся, пустые или поврежденные записи, присутствие кода HTML в записи, неправильное форматирование (буква вместо цифр и наоборот), разные варианты написания одного и того же понятия (BBC и B.B.C., NY Times и The New York Times) и другие.
К наиболее простым способам очистки данных относится фильтрация посредством программ Excel или Google Docs. Более сложным инструментом является Google Refine, с помощью которого можно преобразовать все записи в строчные прописные или заголовки, удалить HTML пробелы до и после записей, удалять двойные пробелы, объединять и разбивать ячейки, форматировать их последовательно и другое.
3. Комбинирование данных и их анализ
На данном этапе происходит объединение новых данных с уже имеющимися, если необходимо. Создать медиатекст можно и с использованием одного набора данных, однако ценность материала возрастает, если таких наборов несколько. Классическая комбинация — карта mashup, то есть объединение набора данных с данными карты, чтобы обеспечить мгновенную визуализацию того, как определенные объекты/явления распределяются в пространстве: местоположение лучших школ, самые обсуждаемые темы по всему миру на Twitter и другое. Грамотная комбинация наборов данных позволяет создавать более насыщенные и интересные истории.
Далее с помощью специального программного обеспечения осуществляется унификация скомбинированных данных, отбираются данные, строго отвечающие креативной концепции и сюжету готовящегося материала, производится дешифровка и анализ данных, а также их подготовка к дальнейшей визуализации.
4. Визуализация
Является одним из наиболее важных этапов, так как без визуализации даже обработанные и проанализированные данные трудно воспринимать, и именно от того, насколько качественно выполнена визуализация, зависит эффективность коммуникации с читателем.
Как правило, визуализация относится к сфере ответственности проектировщиков и кодировщиков, однако в последнее время некоторые журналисты, владеющие необходимыми навыками, пробуют выполнять ее самостоятельно. Bradshaw P. How to be a data journalist // The guardian [электронный ресурс] URL: https://www.theguardian.com/news/datablog/2010/oct/01/data-journalism-how-to-guide (дата обращения 03.05.2017) Визуальное сопровождение создается в виде карт, инфографики, диаграмм, анимации, интерактивных форматов, также могут использоваться аудио-и видеоматериалы.
Число программ, с помощью которых можно выполнить визуализацию, увеличивается с каждым годом. Для визуализации данных в виде графиков и диаграмм доступны такие приложения, как Many Eyes или Public. Yahoo. К инструментам, позволяющим создавать карты на основе электронных таблиц данных, относятся Pipes, Open Heat Map и другие.
5. Формирование итогового медиатекста
К материалам, полученным в ходе анализа данных, добавляется выполненная визуализация и журналистский текст. Таким образом, создается материал, объединенный единой идеей. Главная сложность заключается в том, чтобы удачно скомпоновать данные с историями, которые освещены в рамках написанного текста. В результате проделанной работы получается медиатекст, сочетающий на одной странице ряд визуализаций, статей и ссылок на данные.
6. Публикация
Публикация медиатекста в журналистике данных обязательно сопровождается прикреплением ссылки, по которой можно получить доступ к исходным, «сырым» данным.
Журналисты должны предоставить ссылку на данные, которые они использовали, чтобы другие могли изучить затронутую тему и внести свой вклад в исследование. Возможно, будут проведены дополнительные опросы, анализ, произведена иная интерпретация данных, что в итоге позволит сделать новые выводы и по-новому взглянуть на исследуемую проблему/ явление.
В целях структурирования и обеспечения доступа к данным могут быть использованы такие инструменты, как Google Refine (с открытым исходным кодом), Data Wrangler и Google Spreadsheets, позволяющие загружать, извлекать или форматировать данные. Так, «The Guardian» для обмена собранными данными использует общедоступные таблицы Google Spreadsheets, которые не требуют специальные инструменты для просмотра и которые можно загрузить практически в любом формате.
7. Оценка
Заключительным этапом процесса является измерение количества просмотров набор данных и материала в целом, а также проверка наличия обратной связи, которая имеет принципиальное значение в журналистике данных. Сюда же относится коммуникация с пользователями и дальнейшее обсуждения затронутой темы.
Таким образом, создание дата журналистского медиатекста многоэтапный процесс, требующий значительных усилий и высокой концентрации внимания. Важно, чтобы действия всех членов команды разработчиков были согласованными, так как высока вероятность допустить ошибку, произвести некачественную очистку данных, отобрать нерелевантные данные (например, если у кодера и аналитика нет понимания креативной концепции, за которую ответственен журналист) или неправильно их проинтерпретировать. В противном случае все это негативно отразится на содержании медиатекста и дальнейшем выстраивании коммуникации с аудиторией.
Выводы по главе:
Медиатекст — относительно новый тип текста, появившийся в конце XX века и формировавшийся по мере становления сетевого общества и развития информационно-коммуникационных технологий. В основе медиатекста лежит сочетание вербальных и невербальных систем, текстовых и визуальных средств.
Типология медиатекстов обширна, и зависит от выбранных конкретным исследователем критериев разделения, однако канонической классификации не существует, что обусловлено многообразием современных медийных текстов.
Особенности медиатекста, определяющие его специфику, во многом обусловлены особенностями современного информационно-коммуникативного пространства, а также зависят от того, посредством каких каналов осуществляется его распространение, однако любой медиатекст можно охарактеризовать, как массовый, медийный, интертекстуальный и поликодовый.
Технологический цикл создания медиатекста варьируется в зависимости от того, в рамках какого журналистского направления он производится. Так, технологический цикл разработки дата журналистского медиатекста — сложный, многоступенчатый процесс, требующий значительных усилий и временных затрат.
Функции и особенности медиатекстов, основанных на больших и открытых данных, рассмотрены в третьей главе данной работы.
Глава 3. Анализ дата журналистских медиатекстов в практике зарубежных СМИ
Цель исследования заключается в выявлении специфики дата журналистского медиатекста посредством анализа материалов, представленных в зарубежных изданиях «The Guardian» и «The New York Times». Выбор данных интернет-СМИ был обусловлен следующими критериями: 1) обозначенные издания являются ведущими в области работы с данными; 2) в каждом из них есть блог, специализирующийся на предоставлении дата журналистских материалов.
Количество медиатекстов в дата-блогах выбранных изданий увеличилось в последние годы, что косвенно может свидетельствовать о возрастающем интересе к дата журнализму как со стороны журналистов, так и со стороны аудитории.
В ходе проведения исследования было изучено более 100 дата журналистских материалов. Однако в процессе отбора материалов для анализа было выявлено, что не все тексты, публикуемые в дата-блогах, базируются на использовании больших и открытых данных. Так, в разделах «Datablog — data» онлайн версии британской газеты «The Guardian» и «The Upshot» американского издания «The New York Times» встречается достаточно много публикаций, представляющих собой обычный сетевой медиатекст: текстовое сообщение, иллюстрируемое инфографикой или картинками/ фотографиями. Материалы преимущественно по журналистике данных в «The Guardian» представлены в разделах «data visualisations» и «datablog and data visualisations», в издании «The New York Times» все публикации представлены в одном разделе «The Upshot». На странице «The Upshot» прописано, что блог предоставляет новости, аналитические материалы и графику о политике и повседневной жизни, т.е. не только материалы, имеющие отношение к журналистике данных В соответствии с целью исследования для анализа отбирались только дата журналистские медиатексты.
В связи с большим суммарным объемом публикаций, изучить которые не представляется возможным, а также с ограничениями, обусловленными объемом данной работы, в рамках исследования было проанализировано 12 медиатекстов, отобранных в зависимости от времени их публикации: в каждом издании рассматривалось по одному материалу за каждый год с момента запуска дата блогов. «Datablog» издания «The Guardian» запущен в 2009 году, однако в архиве публикации начинаются с 2010 года. В «The New York Times» блог по журналистике данных — «The Upshot» — был запущен в 2014 году. В качестве критериев анализа выступали следующие позиции: название материала, тема/ключевое сообщение, разработчики, база данных, компоненты медиатекста, ключевые характеристики, обратная связь. Анализ материалов представлен в виде сводной таблицы в Приложении 1.
В первом пункте данной главы представлен подробный анализ еще 5 медиатекстов: Таким образом, всего в рамках исследования было проанализировано 17 медиатекстов. 3 публикации «The Guardian» и 2 материала «The New York Times».
Во втором пункте содержится описание характеристик и функций медиатекстов в журналистике данных, выявленных в процессе изучения материалов дата журнализма.
В третьем пункте представлен анализ результатов, полученных в ходе проведения фокус-групп.
3.1 Анализ структуры контента дата журналистских медиатекстов в изданиях «The Guardian» и «The New York Times»
Материалы британского интернет-издания «The Guardian»
Разработка медиатекста осуществлялась командой профессионалов, среди которых: журналист С. Роджерс, автор материала, Эндрю Бартон, фотограф, Мария Сантос, веб-дизайнер, а также кодер.
Контент:
Содержание медиатекста не структурировано (отсутствует деление на блоки) и оформлено в виде сплошного текста, в рамках которого освещаются следующие темы:
1) как распределяется богатство Америки среди населения, и кто владеет его большей частью;
2) кто получил наибольшую выгоду во время президенства Б. Клинтона и Дж. Буша;
3) количество проживающих в США миллионеров и биллионеров в сравнении с числом живущих за чертой бедности;
4) снижение доходов населения в целом и причины этого явления;
5) разница в проценте уплачиваемых налогов в зависимости от степени богатства.
С. Роджерс констатирует, что в результате американского экономического бума некоторые люди выиграли намного больше, чем другие. Данное утверждение является центральным в анализируемом медиатексте.
Визуализация и интерактивные компоненты:
Несомненным преимуществом материала является интеграция нескольких вербальных и невербальных компонентов. Так текст сопровождается фотографией, на которой изображены участвующие в забастовке лего-люди с плакатами. Кроме этого, медиатекст содержит видеофайл, в мультипликационной форме передающий содержание словесного контента. Ключевым элементом материала является интерактивный мэшап — карта бедности Америки. Пользователи могут выбрать интересующий их штат и посмотреть следующие показатели:
1) каков процент людей, проживающих в нищете;
2) процент без медицинского страхования;
3) сколько людей не может себе позволить качественно питаться, за период с 2008 по 2010 годы;
4) процент работников, почасовые ставки которых находятся на уровне и ниже минимально установленной заработной платы;
5) средний доход населения за 2010 г.
В медиатексте присутствует немало гиперссылок на сопутствующие материалы: на различные исследования, на результаты опросов, на статистические данные, на личные страницы создателей проекта.
База данных:
В конце содержится ссылка, обеспечивающая доступ к исходной базе «сырых» данных, взятых из разных источников. Данные представлены в таблице Excel.
Обратная связь:
В конце материала также содержится несколько важных опций:
1) для тех, кто умеет работать с данными — ссылка на платформу, где пользователь может опубликовать свои материалы с элементами визуализации;
2) ссылка на е-mail для тех, у кого есть вопросы/ предложения/дополнения по представленному материалу;
3) ссылки на профили в социальных сетях и на другие похожие публикации.
Данный материал затрагивает важную социальную проблему, волнующую многих граждан — проблему социального неравенства. Актуальность темы подтверждается показателями обратной связи: 127 человек поделились материалом на фейсбуке, 58 пользователей оставили комментарии. Первый показатель является самым высоким в сравнении с показателями всех остальных публикаций за 2011 год, по числу комментариев анализируемый медиатекст занимает второе место.
Содержание комментариев в основном нейтральное и представляет собой обсуждение затронутой темы: люди делятся своим мнением, вступают в дискуссию по поводу неравного соотношения богатых и бедных в стране, высказывают свое согласие/ несогласия с позицией С. Роджерса. Это свидетельствует о том, что опубликованный медиатекст находит отклик среди аудитории, привлекает внимание к общественно значимым аспектам и вовлекает пользователей в обсуждение социальных проблем.
What does the 2011 Census tell us about diversity of languages in England and Wales? 2013 год
Тема и источник данных
[Электронный ресурс]//URL: https://liarte.ru/diplomnaya/mediatekst-2/
Материал этой статьи основывается на данных переписи 2011 года и посвящен описанию разнообразия языков, на которых говорят в Англии и Уэлсе.
Автор:
Данный медиатекст представляет собой отредактированный создателем дата блога С. Роджерсом авторский материал, выполненный географом Университетского колледжа Лондона Гаем Ленсли.
Содержание и структура:
Г. Ленсли проанализировал и визуализировал данные и сделал ряд выводов о распространенности разных языков в Англии. Так, было установлено, что
1) только в Лондоне более 690 000 человек выбрали европейский язык не британского происхождения в качестве основного, и почти 150 000 из них были носителями польского языка;
2) в общей сложности 1,7 млн. человек в Лондоне являются носителями языков, отличных от английского;
3) более полумиллиона определили южноазиатский язык в качестве основного языка в переписи 2011 года, а еще 100 000 определили восточноазиатский язык;
4) более 130 000 человек в качестве основного назвали один из языков Африки.
Таким образом, несмотря на то, что только 0,3% населения не владеют английским, 4 млн. человек не говорят на нем в качестве основного языка. По мнению Г. Ленсли, эти и другие полученные результаты демонстрируют космополитическую смесь жителей и позволяют охарактеризовать Лондон как «глобальный город» Британии.
Говоря о структуре, стоит отметить, что материал разделен на 6 блоков, озаглавленных в соответствии с основной идеей излагаемого материала: «как я создавал визуализацию», «Англия и Уэльс», «Манчестер» и другие. Текст каждого блока сочетается с картинкой, представляющей собой карту, на которой показана распространенность языков в конкретном городе или области Англии.
Визуализация и интерактивные компоненты:
Инфографика в данном медиатексте простая и ее немного, словесная часть хорошо структурирована, поэтому материал воспринимается легко, однако текстовая часть довольно большая по объему, В сравнении с другим материалом этого же года под названием «16 useless infographics»;
16 useless infographics // The Guardian [электронный ресурс] URL: https://www.theguardian.com/news/datablog/gallery/2013/aug/01/16-useless-infographics (дата обращения: 07.05.2017) поэтому на ее изучение придется потратить некоторое время. Для тех, кто хочет не просто ознакомиться с результатами исследования, а стремится изучить вопрос более детально, в медиатексте содержится ссылка на карту с данными, созданную по принципу мэшапа.
Карта отображает данные переписи по областям. Перепись охватывает 34753 области по 1500 человек в каждой, что свидетельствует об огромном количестве задействованных данных. В рамках проведения переписи задавался вопрос о том, какой язык для человека является основным. Каждая область окрашена в определенный цвет, обозначающий наиболее часто встречающийся разговорный язык, за исключением английского. Важно отметить, что на картах отображается только категория «основной язык», то есть они не указывают на отсутствие навыков владения английским языком.
Пользователи могут выбрать интересующий их язык (французский, русский, польский, испанский, итальянский, арабский и другие) и посмотреть, каков процент носителей этого языка в разных областях Англии. Подобный мэшап — яркий пример использования принципа интерактивности.
Еще одной важной особенностью данного медиатекста является его гипертекстовость: в материале есть ссылки на статистические исследования, на профиль Г. Ленсли в твиттере, на другие материалы в дата блоге, связанные с переписью или с упоминаемым городом/ графством.
Ключевой характеристикой медиатекста как продукта дата журнализма является обеспечение доступа к исходным данным, представляющим собой несколько таблиц, заполненных цифрами, которые можно скачать. Редактировать их нельзя, однако есть опция, позволяющая отправить редакторам сообщение. В сообщении пользователь может указать на несоответствие представленных данных или, к примеру, предложить имеющийся у него материал, который по решению редакции может быть опубликован.
Обратная связь:
Обратная связь в данном медиатексте характеризуется следующими показателями: 268 человек поделились материалом в фейсбук и 63 человека его прокомментировали. Оба показателя являются средними в сравнении с показателями других медиатекстов, опубликованных в 2013 году. Некоторые материалы за 2013 год имеют показатель «share» Поделиться от 2000 и больше, а также число комментариев от 200 и более. Такие публикации в основном содержат много яркой инфографики и аудиофайлы. Однако есть и материалы с единичными показателями, поэтому можно говорить о том, что описываемый медиатекст вызвал интерес со стороны аудитории. Что касается содержания комментариев, то оно по большей части негативное: многие отмечали отсутствие информативности, предлагали другие критерии классификации языков, указывали на плохую распознаваемость цветов на картах, сложность восприятия материала в целом. Были также и немногочисленные положительные комментарии, в которых хвалилась визуализация, и отмечалась значимость проделанной работы.
3. How the world got fat: a visualization of global obesity over 40 years, 2017 год
Тема и источник данных:
[Электронный ресурс]//URL: https://liarte.ru/diplomnaya/mediatekst-2/
Данный медиатекст посвящен исследованию проблемы ожирения во всех странах мира за период с 1975 по 2014 годы. Материал базируются на анализе и систематизации данных исследования ученых-медиков, опубликованном в медицинском журнале «Lancet». Ученые из NCD-RisC Сотрудничество по факторам риска NCD (NCD Risk Factor Collaboration, NCD-RisC) — это мировое сообщество ученых-медиков, которые предоставляют точные и своевременные данные о важнейших факторах риска неинфекционных заболеваний во всех странах мира. объединили результаты, полученные за последние 40 лет в ходе проведения 1698 исследований, касающихся ожирения взрослого населения. Собранные данные охватывают 186 стран и 19,2 млн. участников. В медиатексте содержится ссылка на исследование, включающее огромное количество данных, описаний, статистик, которые довольно сложно воспринимать, не владея медицинской терминологией.
Автор:
Макс Галка проанализировал данные исследования и создал динамическую визуализацию, отражающую все изменения в едином графике.
Структура и содержание:
К недостаткам медиатекста можно отнести отсутствие структурированности: сплошной текст без деления на блоки и подзаголовков. В связи с этим, даже несмотря на то, что объем текста небольшой, воспринимается он довольно сложно. Восприятие также затрудняется вследствие наличия контекстной рекламы, которая иногда может отвлекать. С другой стороны, определяющую роль в данном материале играет не текст, он только дополняет созданную М. Галка визуализацию.
Содержание текста основывается на двух смысловых частях:
1. В первой автор приводит краткие общие выводы по исследованию. Так отмечено, что с 1975 года показатели ожирения возросли во всех странах мира без исключения, а также что в глобальном масштабе взрослый человек в 2014 году в три раза чаще страдает ожирением по сравнению со взрослым в 1975 году. Кроме этого, определяется страна-лидер по обозначенной проблеме — Китай, уровень ожирения в которой на сегодняшний день составляет 8%, что на 7,95% больше, чем в 1975 году, а также характеризуются некоторые другие страны.