Нижегородский государственный университет им. Н.И.Лобачевского
Национальный исследовательский университет
Учебно-научный и инновационный комплекс
«Социально-гуманитарная сфера и высокие технологии:
теория и практика взаимодействия»
Иудин А.А.
Рюмин А.М.
Контент-анализ текстов:
компьютерные технологии
(Учебное пособие)
Мероприятие 1.2. Совершенствование образовательных технологий,
укрепление материально-технической базы учебного процесса
Учебная дисциплина: Методы анализа документов в социологии
Специальности, направления: Социология – 040201,
Социальная работа – 040101
Нижний Новгород – 2010
УДК 316.77
ББК 60.56
Традиционные и компьютерные методы анализа документов в социологии. Учебное пособие. Нижний Новгород, ННГУ, 2010. 37 с.
-
Учебное пособие подготовлено в соответствии с государственным образовательным стандартом высшего профессионального образования. В нем изложены теоретические основы и практические рекомендации, описывающих работу с документами с использованием традиционных и новых методов анализа. Предназначено для студентов дневной и заочной формы обучения по специальности 040201 (Социология) и 040101 (Социальная работа).
_________________________________________________________
ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ 3
ЧАСТЬ I. ИСТОРИЧЕСКИЕ И МЕТОДОЛОГИЧЕСКИЕ
ОСНОВАНИЯ КОНТЕНТ-АНАЛИЗА 6
1.1. Из истории метода 6
1.2. Назначение, область применения
и особенности контент-анализа 10
ЧАСТЬ II. МЕТОДОЛОГИЯ, МЕТОДИКА
И ТЕХНИКА КОНТЕНТ-АНАЛИЗА 16
2.1. Основные методологические категории метода 16
2.2. Организация исследования 22
2.3. Процедура проведения контент-анализа в пакете Lekta 32
ЛИТЕРАТУРА 35
ПРИЛОЖЕНИЕ. ЗАРУБЕЖНЫЕ КОМПЬЮТЕРНЫЕ ПАКЕТЫ
КОНТЕНТ-АНАЛИЗА 36
ВВЕДЕНИЕ
Самым распространенным видом информации является информация, представленная в виде текстов на языке данной страны, поэтому анализ текстов является одним из наиболее распространенных видов научного и научно-практического анализа. Более того, существуют науки, которые целиком или в основном описаются именно на анализ текстов. Наиболее распространенным направлением анализа текстов является сжатие информации – возможность выделить из совокупности текстов наиболее существенные, концептуальные моменты, важные для данного конкретного направления исследований. Традиционные формы сжатия информации – аннотирование, конспектирование, реферирование – уже давно не считаются какими-то специфическими видами работы с информацией и ими владеют любые специалисты.
Понятие анализ текстов иногда употребляется как синоним понятия контент-анализ, хотя последнее понятие шире. Контент-анализ относится к более широкой области исследований, затрагивающих не только текст, но информацию различного рода — изображения, аудио и видеоинформацию. Кроме того, контент-анализ, в отличие от других способов изучения документов, позволяет вписать содержание документа в социальный контекст, осмыслить его как проявление или как оценку социальной жизни. Понимание социального контекста документа предполагает выявление того, что именно получило в нем отражение, какой резонанс этот документ получил или может получить в общественной жизни и, наконец, степень оригинальности документа, отличие его от других документов такого рода.
Контент-анализ — это метод количественного систематического подхода к изучению текста. Важным является то, что он формализован. Формализованность, систематичность и строгость контент-анализа проявляется в том, что исследование проводится на основании методологически обоснованной программы, по определенным процедурам и служит для получения информации, отвечающей некоторым критериям качества.
С помощью контент-анализа изучались религиозная символика и популярные песни, устанавливались отличия эротических кинокартин от порнографических, устанавливалась мера эффективности политических слоганов, реклам и вражеской пропаганды, определялись особенности суицидального поведения, проявившиеся в предсмертных записках самоубийц, стереотипы сознания различных социальных групп, выявлялась направленность демонстрации людей определенной национальности на телеэкранах, идеологическая подоплека передовиц газет, отличия в трактовках одного и того же события в разных СМИ, исследовались многие другие темы.
В последние десятилетия данный социологический метод заимствовали и активно используют представители социогуманитарных наук, заинтересованные в установлении объективных признаков разнообразных человеческих коммуникаций. Сюда следует отнести юристов, историков, журналистов, языковедов, литературоведов, культурологов, политологов, психологов, экономистов, социальных работников. Среди множества профессиональных областей использования метода можно выделить прикладную лингвистику, историю, искусствоведение, антропологию, связи с общественностью, коммуникативистику, педагогику, криминологию, этнографию, нарратологию.
Разработка методов анализа текстов в настоящее время идет в четырех направлениях:
-
определение соотношения и взаимодействия информационных методов с методами опроса и другими методами сбора данных при постановке исследуемых задач;
-
разработка технических разновидностей методик анализа информации применительно к специфике текстовых источников в различных отраслевых социологиях;
-
обогащение методов анализа информации методологическими и методическими принципами смежных наук с развитыми методами анализа различных видов источников;
-
разработка специализированного программного обеспечения для проведения контент-анализа.
В данном учебном пособии описаны общие принципы работы с методом контент-анализа, представлена история его развития, теоретические и практические сведения о нём. Важной особенностью современного этапа генезиса как качественных, так и количественных методов работы является их компьютеризация. Повышая эффективность работы, скорость обработки данных, увеличивая точность анализа, позволяя затрачивать меньше усилий на механические этапы исследований, постоянно развиваясь и создавая ряд других важных возможностей для исследователя, такая тенденция ставит и ряд дополнительных актуальных задач. Среди них особо стоит выделить необходимость совершенствования навыков работы с компьютерным программным обеспечением, в силу чего в методическом пособии предоставлено описание особенностей обработки текстовых массивов на примере компьютерного пакета ЛЕКТА. Программа позволяет производить контент-анализ текстового материала, прослеживая основные эксплицитные сюжетные линии, идентифицировать латентные идеи, стереотипы и т.д. Её исключительно важной и оригинальной особенностью является не простой подсчёт частотности использования индикаторов, дающий сравнительно мало данных для анализа, а установление групп корреляций между ними, определяемой возможностью проведения факторного анализа инструментами пакета. Также в приложении к пособию приведены краткое описание функционала нескольких иностранных пакетов, предназначенных для аналитической работы с текстовыми массивами.
Сегодня специалисту-социологу необходимо знать теоретические основы контент-анализа, обладать навыками работы с описанным в пособии и аналогичным программным обеспечением, в силу широкой востребованности метода и очевидных перспектив расширения областей его использования и развития функционала.
Курс носит обязательный характер. Освоение курса требует знания программ университетского курса по дисциплинам «Методика и техника социологических исследований», «Статистика и теория вероятностей», «Информатика», «Статистические методы обработки экспериментальных данных», «Социальное моделирование и программирование». Курс предназначен для освоения студентами основных навыков анализа вербальной информации. Лекционные и практические занятия направлены на формирование у студентов целостного понимания анализа информационных потоков и освоения ими навыков контент-анализа. В результате изучения курса студент должен:
-
знать основные этапы развития анализа документов и вклад различных исследовательских школ в развитие контент-анализа;
-
изучить основные теоретические и методологические направления изучения документов в социологии;
-
иметь представления о типах методов анализа документов и применяемом программном обеспечении;
-
уметь на практике использовать изученные методы;
-
провести от начала до конца один учебный проект.
В рамках курса проводится серия лабораторных работ. Она нацелена на выработку у студентов творческого подхода к решению конкретных задач и сознанного применения различных методов анализа. В ходе выполнения курсовой работы студент должен применить на практике все методы анализа, с которыми он был ознакомлен в ходе аудиторных занятий.
ЧАСТЬ I. ИСТОРИЧЕСКИЕ И МЕТОДОЛОГИЧЕСКИЕ
ОСНОВАНИЯ КОНТЕНТ-АНАЛИЗА
1.1. Из истории метода
В советской социологической литературе происхождение контент-анализа связывалось с именами У. Томаса и Ф. Знанецкого, однако ныне многие отечественные исследователи отмечают, что он возник сто и более лет тому назад. Первый упоминаемый в литературе опыт использования метода, очень близкого к этому (прикладная цель которого выглядит очень узнаваемой) Г.Г. Почепцов1 относит к XIII в., когда в Швеции был осуществлен анализ сборника из 90 церковных гимнов, прошедших государственную цензуру и приобретших большую популярность, но обвиненных в несоответствии религиозным догматам. Наличие или отсутствие такого соответствия и определялось подсчетом в текстах этих гимнов религиозных символов и сравнения их с другими религиозными текстами, в том числе тех, которые считались еретическими. Частота использования определённых заранее собранных слов и тем позволяла судить о том, насколько корректен текст с точки зрения официального учения церкви.
Важно отметить, что простой подсчёт частотности употребления какого-либо слова давал сравнительно мало материала для точного и глубокого анализа проблемы. Установление семантических связей между отдельными единицами контент-анализа позволяет получить более полную картину.
В конце XIX – начале XX вв. в США появились первые контент-аналитические исследования текстов массовой информации. Их мотивация выглядит удивительно знакомой: авторы задавались целью продемонстрировать прискорбное пожелтение тогдашней нью-йоркской прессы. На рубеже XIX и XX веков развитие средств массовой коммуникации, увеличение количества информационных каналов и потоков и, как следствие, их дезориентирующее влияние на человека потребовали метода систематизации материала, его обобщения. Сам термин контент-анализ (content-analysis) впервые был использован в США журналистами Д.Уипкинсом, А.Тенни, Д.Спиидом, Б.Мэттью. Принципы методики также были частично описаны французским журналистом Ж.Кайзером.
Контент-анализ как сформировавшийся метод исследований изучения массовых коммуникаций первоначально был количественно-ориентированным. Впервые он был использован Максом Вебером в 1910 году для анализа освещаемости прессой политических акций в Германии. Позднее, в 1937 году метод контент-анализа был использован в США в исследовании инаугурационных речей американских президентов, в рамках которого были изучены наиболее общие категории, отражающие национальные, исторические, фундаментальные и оценочные аспекты.
Чтобы получить материалы для своей книги о судьбе польских крестьян, эмигрировавших в США, У. Томас и Ф. Знанецкий2 провели колоссальную работу по сбору личной документации. Одним из путей решения этой задачи была публикация, объявленная в газете с просьбой к полякам, приехавшим в США, присылать свои жизнеописания и письма родственников по определенному адресу за незначительную плату 10 центов за материал.
Этот метод сбора материала, точнее методологические позиции авторов, были раскритикованы спустя почти 20 лет американским социологом Блумергом. Он отметил, что эти материалы носили лишь иллюстративный характер и никоим образом не могли быть использованы в качестве доказательства конкретной точки зрения. После этого экспертная комиссия Национального совета по социальным исследованиям США создала специальный комитет, на котором анализировались проблемы, связанные со степенью искажения материала при передаче мысли и при записи. В этой связи ставился вопрос о том, в какой мере само оформление того или иного личного документа – заявления или дневника – соответствует реальным намерениям этого автора и действительному положению дел.
Опыт первой мировой войны сформировал большую группу серьезных исследователей в области пропаганды, и паблик рилейшнз. Тогда в США был создан комитет под руководством Джорджа Криля, который занимался составлением пропагандистских материалов.
Во время второй мировой войны, в США и Великобритании контент-анализ использовался государственными структурами в военных целях и в целях исследования направлений пропагандистской деятельности. В это же время в Великобритании сотрудники радио BBC анализировали пропагандистские материалы нацистов и составляли прогнозы по поводу ведения ими внешней и внутренней политики. Один из самых замечательных примеров использования контент-анализа принадлежит британским аналитикам, верно предсказавшим время запуска крылатых ракет «ФАУ-1» и баллистических ракет «ФАУ-2» Германией против Великобритании.
В исследования пропаганды значительный вклад внес Гарольд Лассуэлл.3 В 1927 г. вышла его докторская диссертация под названием «Техники пропаганды в мировой войне». Эта книга была качественной (с точки зрения методологии), в ней оценивались техники пропаганды двух сторон военных действий. В частности он произвёл анализ содержания газеты «истинный американец» и привёл аргументированные доказательства того, что она поддерживает фашизм, после чего публикация газеты была запрещена. При этом Лассвелла критикуют за некорректное соотнесение качественных и количественных методов, не позволяющее провести верификацию результатов.
Г. Лассуэл сформулировал три основные функции коммуникации в обществе:
-
Наблюдение над окружающим миром: эта роль масс-медиа позволяет индивиду видеть гораздо больше, чтобы узнавать о событиях во всем мире.
-
Корреляция ответа общества на события в окружающем мире: масс-медиа рассказывает индивидууму как интерпретировать происходящие события.
-
Передача культурного наследия, например: дети изучают жизнь других людей, что такое хорошо и что такое плохо, чем они отличаются от других людей.
Широко известна формула Лассуэлла из пяти вопросов: «Кто и что говорит, по какому каналу, кому и с какими эффектами?», дающая простой и четкий формат описания коммуникации.
Накопленный опыт лёг в основу создания книги, написанной Б. Берелсоном в начале 1950-х годов XX века «контент-анализ в коммуникационных исследованиях». Она до сих пор считается фундаментальным трудом, описывающим наиболее общие положения этой молодой методики исследований. После её появления метод приобрёл большую популярность и стал широко использоваться и совершенствоваться в самых разных сферах. Так, например, появилась методика связанности символов Ч. Осгуда4, позволявшая определить коррелирующие между собой части содержания текста. Европейские исследователи опирались главным образом на опыт американских специалистов в области контент-анализа.
В начале 1960-х гг. Г. Лассуэлл осуществил попытку политологического анализа СМИ, исходя из учета формальных критериев. Он ввел в научный оборот абстрактную единицу – слово. Целью работы Лассуэлла было получение собственно социологического результата на нетипичном для социологии материале – текстах печатных изданий. Исследователь проделал огромную работу, но, поскольку в методике Лассуэлла качественные оценки не были адекватно соотнесены с количественными, результаты его трудов с трудом поддавались верификации.
В этот же период Ж. Кайзер разработал новую методику статистического анализа периодических изданий, в основе которой лежал подход к тестовому массиву, как информационной системе. Тем самым Кайзер сформулировал теоретическую базу последующего распространения социологических методов в сферы изучения всех нарративных источников, включая эпиграфический и эпистолярный материал. В работе Ж. Кайзера акцентировалось внимание на внешней форме организации материала: его расположении, оглавлении, оформлении и т.д. Кайзер разработал целый комплекс исследовательских процедур, обеспечивающих полную формализацию, как единичного газетного номера, так и совокупности однотипных периодических изданий. Тем самым Ж.Кайзер сформулировал систему, позволяющую фиксировать развитие тенденций в публикациях СМИ.
Дальнейшее развитие кайзеровское направление методологии контент-анализа получило в работах Э. Морэн, которая ввела в научный оборот термин единица информации – семантический блок, содержание которого отвечает на вопрос: «О чем говорится?» Последнее обстоятельство сделало возможным изучение любых форм организации текстового материала, причем, как на терминологическом уровне, так и на уровне фразы, абзаца, статьи и даже целых книг. Тем самым, Э. Морэн разрушила критерий однородности, применявшийся ранее при статистической обработке нарративов. Взамен, она предложила идеологию семантических групп, которые, по ее мнению, должны учитываться по тематическому признаку. Кроме того, Э. Морэн разработала концепцию тона материала, который определялся социометрически: положительная информация, отрицательная, нейтральная.
Следующим этапом в развитии метода в области проведении исследований, имеющих дело с большими объёмами текста, стало использование ресурсов ЭВМ. Так в 1974 году в Италии на конференции, посвящённой проблемам контент-анализа, было представлено несколько проектов, реализуемых посредством машинной обработки данных. Они заключались в анализе заголовков статей опубликованных в большом количестве газет и сравнении степени внимания в них к региональным, общегосударственным и международным проблемам; в сравнении интереса американских и европейских СМИ к тенденциям развития «общего рынка» и т.д. На этом собрании Германия выступала с проектом создания словаря, который мог бы быть использован в проведении контент-анализа текстов.
В СССР метод контент-анализа стал использоваться с конца 1960-х годов. Например, это исследования А.В. Баранова, направленные на изучение степени обращения к субъективным интересам читателей в газете «Известия»; исследования Б.А. Грушина по изучению информированности читателей ряда СМИ о существующих проблемах.
Наиболее широкое распространение контент-анализ получил в теории массовой коммуникации, политологии и социологии. Этим отчасти объясняется тот факт, что иногда этот термин используется как обобщающий для всех методов систематического и претендующего на объективность анализа политических текстов и текстов, циркулирующих в каналах массовой коммуникации. Однако такое расширительное понимание контент-анализа неправомерно, поскольку существует ряд исследовательских методов – либо специально разработанных для анализа политических текстов (например, метод когнитивного картирования), либо применимых и применяемых для этой цели (например, метод семантического дифференциала или различные подходы, предполагающие изучение структуры текста и механизмов его воздействия), – которые не могут быть сведены к стандартному контент-анализу даже при максимально широком его понимании.
Становление и распространение приобретающей всё большую популярность всемирной глобальной сети Интернет также дало много ресурсов для развития метода контент-анализа и усилило потребность в нём. Сегодня контент-анализ широко используется именно в этой коммуникативной среде, и развитие программного обеспечения, способного в той или иной мере автоматизировать процесс проведения метода, остаётся приоритетной задачей для расширения диапазона его применения. Его разработкой занимаются главным образом в США, Великобритании и Германии. К сожалению, уникальные отечественные разработки программного обеспечения практически неизвестны зарубежным исследователям, использующим метод контент-анализа. Подробнее о зарубежных компьютерных пакетах, применяемых для проведения контент-анализа можно узнать из Приложения №1.
1.2. Назначение, область применения и особенности контент-анализа
Виды документов. Прежде чем приступить к рассмотрению способов анализа документов, необходимо дать определение и классификацию документов. Документом в социологии называется специально созданный человеком предмет, предназначенный для передачи или хранения информации.
По способу фиксирования информации различают рукописные и печатные документы; записи на кино- или фотопленке, на магнитной ленте. Сегодня, в связи с широким распространением и универсализацией электронных средств хранения, передачи и обработки информации, решающее значение приобретает классификация документов на цифровые (машинно-читаемые) и аналоговые (не читаемые с помощью компьютера).
С точки зрения целевого назначения, выделяют материалы, которые были провоцированы самим исследователем (к примеру биография эмигранта в работе Томаса и Знанецкого — в числе использованных документов была уникальная автобиография одного из крестьян, написанная по просьбе исследователей и составившая около 300 страниц). Эти документы называют целевыми. Но социолог имеет дело и с материалами, составленными независимо от него, ради каких-то других целей, т.е. с наличными документами. Обычно эти материалы называют собственно документальной информацией в социологическом исследовании.
По степени персонификации документы делятся на личные и безличные. К личным относят карточки индивидуального учета (например, библиотечные формуляры или анкеты и бланки, заверенные подписью), характеристики и рекомендательные письма, выданные данному лицу, письма, дневники, мемуарные записи. Безличные документы — это статистические или событийные архивы, данные прессы, протоколы собраний.
В зависимости от статуса документального источника выделим документы официальные и неофициальные. К первым относятся правительственные материалы, постановления, заявления, коммюнике, стенограммы официальных заседаний, деловая корреспонденция, протоколы судебных органов и прокуратуры, финансовая отчетность. Неофициальные документы — это многие личные материалы, упомянутые выше, а также составленные частными гражданами безличные документы (например, статистические обобщения, выполненные другими исследователями на основе собственных наблюдений). Особую группу документов образуют многочисленные материалы средств массовой информации: газет, журналов, радио, телевидения, кино, видеоматериалы.
По источнику информации документы разделяют на первичные и вторичные. Первичные составляются на базе прямого наблюдения или опроса, на основе непосредственной регистрации совершающихся событий. Вторичные представляют обработку, обобщение или описание, сделанное на основе данных первичных источников.
Помимо этого, можно, конечно классифицировать документы по их прямому содержанию, например литературные данные, исторические и научные архивы, архивы социологических исследований, видеохроники общественных событий.
Определения контент-анализа. Существует множество определений контент-анализа, но при этом большинство из них едва ли полно отражает его сущность. Приведём наиболее часто употребляемые определения контент-анализа.
-
Это методика объективного качественного и систематического изучения содержания средств коммуникации (Д. Джери, Дж. Джери).
-
Это систематическая числовая обработка, оценка и интерпретация формы и содержания информационного источника (Д. Мангейм, Р. Рич).
-
Это качественно-количественный метод изучения документов, который характеризуется объективностью выводов и строгостью процедуры и состоит в квантификационной обработке текста с дальнейшей интерпретацией результатов (В. Иванов).
-
Это исследовательская техника для получения результатов путем анализа содержания текста о состоянии и свойствах социальной действительности (Е. Таршис).
-
Контент-анализ состоит в нахождении в тексте определенных содержательных понятий (единиц анализа), выявлении частоты их встречаемости и соотношения с содержанием всего документа (Б. Краснов).
Наиболее компактное формальное определение контент-анализа звучит так: «Любая систематическая редукция потока текста (или других символов) к стандартном набору статистически обрабатываемых символов, отражающих присутствие, интенсивность или частоту характеристик, значимых для социальной науки».5
Эти определения дают фрагментарное представление о методе и не учитывают новых возможностей многомерного статистического анализа. Все эти определения могут быть сгруппированы следующим образом:
-
статистическая семантика;
-
техника для объективного количественного анализа содержания коммуникации;
-
техника для разработки обобщений при помощи объективного и систематического установления характеристик сообщений.
Как нам представляется, одним из наиболее адекватных является определение контент-анализа, разработанное психологами. КОНТЕНТ-АНАЛИЗ (англ. сontent – содержание) – метод выявления и оценки специфических характеристик текстов и других носителей информации (видеозаписей, теле- и радиопередач, интервью, ответов на открытые вопросы и т.д.), при котором в соответствии с целями исследования выделяются определенные смысловые единицы содержания и формы информации. Затем производится систематический замер частоты и объема упоминаний этих единиц в определенной совокупности текстов или другой информации. Контент-анализ дает возможность выявлять отдельные психологические характеристики коммуникатора, аудитории, сообщения и их взаимосвязи. В отличие от элементарного содержательного анализа, контент-анализ, как научный метод, используется для получения информации, отвечающей некоторым критериям качества (объективность, надежность и валидность). Заметную роль в повышении качества контент-анализа играет возможность использования методов многомерного статистического анализа данных. Особенно широко используется факторный анализ, способствующий выявлению скрытых факторов, определяющих содержание текстов. Такое определение несколько громоздко и, по сути, представляет собой описание исследовательской техники, тем не менее оно позволит нам отойти от представлений о контент-анализе как простом пересчете слов в текстах.
Специфика метода. Специфика анализа текстов как метода раскрывается через пары понятий, описывающих основные контрасты метода. Дедукция или индукция: от общего к частному или от частностей к общим закономерностям? Количественная или качественная стратегия: количественная стратегия предполагает более формальный подход и применение статистических методов, тогда как качественная опирается на способность человека понимать и интерпретировать смыслы.
Денотация и коннотация: денотация и коннотация связаны с социальным значением слов, а не с грамматическими правилами их употребления. Денотация – это фиксированное отношение слова к объектам, которые оно описывает (одно слово может иметь несколько денотаций, например, в языке разных социальных групп). Коннотация – это контекстно-зависимое значение слова или ценностная (оценочная) нагрузка. Примеры: окно – отверстие в стене, форточка – часть окна, но также окно компьютерной программы, окна, форточки – сленговое обозначение ОС Windows (вторичная денотация). Слово социализм или демократия будет иметь разные коннотации для молодого и старшего поколения, как в смысле социального опыта, так и в смысле оценки.
Открытое или скрытое значение, смысл слов – описание и интерпретация: различение открытого, непосредственно выраженного смысла и скрытого смысла, значения. Данное противопоставление напоминает различие открытого и скрытого смысла слов, но относится к текстам в целом. Описательный, дескриптивный анализ концентрируется на таких вопросах, как насколько часто и каким образом слово встречается в тексте, тогда как интерпретационный анализ задается вопросами значения слова и причин его употребления в том или ином контексте.
Область применения. Важной особенностью этого метода является систематизация большого по объёму тематически связанного, но не структурированного массива (чаще всего текстового). Предварительная систематизация такого материала позволяет сократить время на его обработку. В этой связи существенную важность имеет грамотный подбор источников получения информации, например печатных и электронных СМИ нужных тематических групп, ориентированных на определённые целевые аудитории. Роль и функции их варьируются в зависимости от особенностей освещения экономико-политических аспектов общественной жизни, идеологической, религиозной и многих других её составляющих, по типу социализирующей и образовательной деятельности, по методам воздействия на целевую аудиторию, по степени объективности публикуемой информации и т.д. Для исследователя крайне важно чётко идентифицировать позиции медиа при отборе массива, в противном случае противоречивость, размытость результатов могут помешать в полной мере, убедительно подтвердить либо опровергнуть гипотезы исследования.
Сферы социологических исследований коммуникации, в которых может применяться анализ текстов:
-
Анализ содержания коммуникации;
-
Анализ формы коммуникации;
-
Анализ производителей коммуникации;
-
Анализ аудитории;
-
Анализ эффектов коммуникации.
Три типа гипотез, которые могут быть протестированы с помощью анализа текстов:
-
гипотезы относительно частоты встречаемости тех или иных терминов, понятий;
-
гипотезы о связи понятий в тексте, отдельных частях текста или совокупностях текстов;
-
гипотезы, касающиеся соотношения между текстуально-аналитическим исследованием и другими видами исследований; гипотезы такого типа используются для сравнения результатов исследований, проведенных с помощью различных методов или для установления связей между текстуальными и не-текстуальными явлениями (например, для сравнения высказываний и реальных действий людей).
Ограничения анализа текстов как метода:
-
для количественного анализа необходимо статистически значимое количество текстуальной информации, он не предназначен для анализа уникальных текстов;
-
анализируемые тексты должны поддаваться формализации, поэтому данный метод лишь ограниченно пригоден для анализа художественной литературы и совсем не пригоден для анализа поэзии;
-
качественный анализ позволяет глубже понять текст, но он требует значительного количества времени и усилий; таким образом, традиционный качественный анализ малопригоден для исследования больших объемов текста. Последнее ограничение ныне снимается посредством создания программных средств, осуществляющих лексический анализ текстов. В последние годы предпринимаются попытки и семантического машинного анализа вербальной информации;
-
главным ограничением является то обстоятельство, что текст менее сложен, чем индивидуальное или общественное сознание, которыми он порожден; текст является упрощенным, редуцированным отражением социальной реальности.
Метод занимает особое место среди других в силу своей эффективности при анализе больших информационных массивов. Чаще всего он используется при анализе текста и заключается либо в подсчёте наиболее часто встречающихся в нём слов, словосочетаний, самостоятельных тем, выраженных, например, целостными абзацами, и других лексических единиц, либо единицами контент-анализа выступают такие величины как протяжённость текста, численность строк, абзацев, колонок, страниц. Метод также применяется и при изучении видео и аудио материала и единицами анализа становятся графическая составляющая, сопровождающая тексты, метраж аудио и видео плёнки с материалами, интересующими исследователя, объём эфирного времени, время суток, в которое материал транслируется аудитории. С помощью этого метода можно изучать такие материалы как, например, статьи в СМИ, речи политиков, партийные программы, программы общественных движений, видеоматериалы массовых мероприятий, съездов и митингов, нормативно-правовые акты, рекламные сообщения, произведения художественной литературы, исторические тексты, письма и многое другое. Обязательным условием проведения контент-анализа является фиксация материала на материальном носителе. Только при его соблюдении возможно использование этого метода.
Часто результаты контент-анализа дополняются использованием других методов. Интересен он также и тем, что не требует больших материальных затрат, несложен в использовании, не подразумевает ощутимых технических и других трудностей при использовании специализированного компьютерного программного обеспечения. Полевой этап исследования более прост, чем при использовании многих других методов. Так, проведение простого (хотя и неглубокого) контент-анализа доступно даже при использовании базовых средств Microsoft Office или его аналогов.
ЧАСТЬ II. МЕТОДОЛОГИЯ, МЕТОДИКА
И ТЕХНИКА КОНТЕНТ-АНАЛИЗА
2.1. Основные методологические категории метода
Контент-анализ как метод предоставляет исследователю богатые и разнообразные возможности, но требует тщательного формирования исследовательской стратегии путем выбора из нескольких альтернатив. Рассмотрим эти альтернативы.
Основа контент-анализа – это подсчет встречаемости некоторых компонентов в анализируемом информационном массиве, дополняемый выявлением статистических взаимосвязей и анализом структурных связей между ними, а также снабжением их теми или иными количественными или качественными характеристиками. Отсюда понятно, что главная предпосылка контент-анализа – это выяснение того, что считать; иными словами, определение единиц текста.
Единицы текста. Единица – это отдельная группа слов, рассматриваемая как целое. Выделяется несколько типов единиц.
Единицы анализа – это единицы, составляющие основу анализа, единицы, которые исследователь стремится охарактеризовать. Пример: слово, газетная статья.
Единицы выборки – части наблюдаемой реальности или потока текста, которые рассматриваются как независимые друг от друга. Они имеют ясно различимые границы, им могут быть присвоены уникальные номера и они могут включаться в выборку с заранее известной вероятностью.
Единицы кодирования (также единицы записи или единицы текста) – это отдельные сегменты текста, помещаемые в ту или иную категорию. Для каждой единицы кодирования исследователь принимает решение, имеет ли она те или иные атрибуты, которые интересуют его в данном исследовании, относятся ли они к теме исследования. Пример: идея превосходства мужчин над женщинами (идея, формирующая категорию) может быть выражена в таких единицах кодирования, как слово, смысл слова, предложение, тема, абзац, текст целиком.
Единицы контекста – это та совокупность текстов, которую необходимо принять в расчет, характеризуя единицу кодирования. Они формируют контекст, который определяет значение, смысл единиц кодирования, в том случае, если этот смысл контекстно-зависим. Например, в статье, посвященной финансовым вопросам, слово долг будет иметь другое значение, чем в тексте, посвященном религиозным вопросам. При анализе текстов без применения компьютера контекст обычно легко распознаваем. В компьютерном анализе контекст, как правило, определяется через анализ слов, окружающих в тексте единицу кодирования.
Единицы счета – это те единицы, с помощью которых квантифицируются атрибуты текста. Они совпадают с единицами кодирования, если исследователь заинтересован в подсчете количества слов или других элементов текста. Другими словами, единицы счета – это именно то, что подсчитывается в процессе исследования, то, к чему относятся числа в матрице данных. Примеры: 5 слов были идентифицированы как относящиеся к агрессии (попадающие в данную категорию). В матрицу ставится число 5 – в данном случае единица кодирования совпадает с единицей счета. Пример несовпадения этих единиц: анализ пространства на страницах газеты, отданного под освещение определенной темы. Статья, идентифицированная как относящаяся к теме – это единица кодирования, а число квадратных сантиметров (в которых измерена площадь статьи и полученный результат занесен в матрицу) – единица счета.
Физические единицы имеют отдельную физическую форму (например, отдельный номер газеты).
Синтаксические единицы – те, которые являются естественными для грамматики соответствующего средства коммуникации (например, слово во фразе или отдельная новость во фразе выпуска новостей). Единицы референции – те, которые описывают разными словами один и тот же объект (например, «глава государства», «президент», «Путин», в определенном контексте – просто «он»). Пропозиционные единицы – это части сложных предложений, имеющие собственную структуру, описания конкретных положений дел (ситуаций). Такие единицы используются для того, чтобы избежать сложности естественного языка. Например, фраза «Агрессивный вор угрожает полицейскому» распадается на два простых предложения «Вор агрессивен» и «Вор угрожает полицейскому».
Единицы различного рода могут пересекаться и включать друг друга. Например, при анализе книг первая единица анализа – это книга, вторая – главы в книгах, третья – параграфы или абзацы. В случае если параграф – наименьшая из единиц, на которые исследователь разбил текст, он также служит и единицей кодирования. Однако можно продолжить делить тест дальше вплоть до предложений или грамматических частей предложений. В таком случае единицей выборки может стать абзац. Каждая единица, которая больше, чем составляющие ее части, может служить единицей контекста: фраза для слова, глава для параграфа и т.д.
Концептуальные категории. Концепт – это единица смысла, отдельная идея. Концептуальные категории – это агрегации единиц текста, основанные на общей идее, релевантной для теоретической основы исследования. Иными словами, категории – результат операционализации идей с помощью слов и фраз. Концепты могут быть образованы дедуктивно (на основе теории) или индуктивно (на основе исследуемых текстов).
Количественный или качественный подход. Количественный контент-анализ в первую очередь интересуется частотой появления в тексте определенных характеристик (переменных) содержания. Качественный контент-анализ позволяет делать выводы даже на основе единственного присутствия или отсутствия определенной характеристики содержания.
Различие двух подходов довольно легко проиллюстрировать примерами. В 1950-е годы западные аналитики на основе количественного анализа статей газеты "Правда" обнаружили резкое снижение числа ссылок на Сталина. Отсюда они сделали вывод, что последователи Сталина стремятся дистанцироваться от него. С другой стороны, качественный аналитик мог бы сделать аналогичный вывод на основе единственного факта, что в публичной речи одного из партийных функционеров, посвященной победе СССР в Великой Отечественной войне, Сталин вообще не был упомянут. Прежде такое было бы немыслимо.
Качественный контент-анализ не слишком высоко оценивается позитивистски ориентированными исследователями. На западе ему отдают предпочтение исследователи, придерживающиеся феминистских, а также критических или интерпретативных подходов. Сторонники количественного подхода также иногда включают качественный контент-анализ в свой методологический арсенал с целью усилить надежность количественных исследований в исследовании содержания текста. В дискуссии о качественном или количественном контент-анализе существует и объединяющая точка зрения, которая представляется наиболее продуктивной. Ее защитники6 утверждают, что должно использоваться некоторое сочетание количественного и качественного анализа.
Поделитесь с Вашими друзьями: |