Прикладная статистика исследование зависимостей. Айвазян, Сергей Артемьевич - Прикладная статистика = Applied statistics: исследование зависимостей: cправочное издание. Общая структура эксперимента по исследованию зависимостей

Чтобы сузить результаты поисковой выдачи, можно уточнить запрос, указав поля, по которым производить поиск. Список полей представлен выше. Например:

Можно искать по нескольким полям одновременно:

Логически операторы

По умолчанию используется оператор AND .
Оператор AND означает, что документ должен соответствовать всем элементам в группе:

исследование разработка

Оператор OR означает, что документ должен соответствовать одному из значений в группе:

исследование OR разработка

Оператор NOT исключает документы, содержащие данный элемент:

исследование NOT разработка

Тип поиска

При написании запроса можно указывать способ, по которому фраза будет искаться. Поддерживается четыре метода: поиск с учетом морфологии, без морфологии, поиск префикса, поиск фразы.
По-умолчанию, поиск производится с учетом морфологии.
Для поиска без морфологии, перед словами в фразе достаточно поставить знак "доллар":

$ исследование $ развития

Для поиска префикса нужно поставить звездочку после запроса:

исследование*

Для поиска фразы нужно заключить запрос в двойные кавычки:

" исследование и разработка"

Поиск по синонимам

Для включения в результаты поиска синонимов слова нужно поставить решётку "# " перед словом или перед выражением в скобках.
В применении к одному слову для него будет найдено до трёх синонимов.
В применении к выражению в скобках к каждому слову будет добавлен синоним, если он был найден.
Не сочетается с поиском без морфологии, поиском по префиксу или поиском по фразе.

# исследование

Группировка

Для того, чтобы сгруппировать поисковые фразы нужно использовать скобки. Это позволяет управлять булевой логикой запроса.
Например, нужно составить запрос: найти документы у которых автор Иванов или Петров, и заглавие содержит слова исследование или разработка:

Приблизительный поиск слова

Для приблизительного поиска нужно поставить тильду "~ " в конце слова из фразы. Например:

бром~

При поиске будут найдены такие слова, как "бром", "ром", "пром" и т.д.
Можно дополнительно указать максимальное количество возможных правок: 0, 1 или 2. Например:

бром~1

По умолчанию допускается 2 правки.

Критерий близости

Для поиска по критерию близости, нужно поставить тильду "~ " в конце фразы. Например, для того, чтобы найти документы со словами исследование и разработка в пределах 2 слов, используйте следующий запрос:

" исследование разработка"~2

Релевантность выражений

Для изменения релевантности отдельных выражений в поиске используйте знак "^ " в конце выражения, после чего укажите уровень релевантности этого выражения по отношению к остальным.
Чем выше уровень, тем более релевантно данное выражение.
Например, в данном выражении слово "исследование" в четыре раза релевантнее слова "разработка":

исследование^4 разработка

По умолчанию, уровень равен 1. Допустимые значения - положительное вещественное число.

Поиск в интервале

Для указания интервала, в котором должно находиться значение какого-то поля, следует указать в скобках граничные значения, разделенные оператором TO .
Будет произведена лексикографическая сортировка.

Такой запрос вернёт результаты с автором, начиная от Иванова и заканчивая Петровым, но Иванов и Петров не будут включены в результат.
Для того, чтобы включить значение в интервал, используйте квадратные скобки. Для исключения значения используйте фигурные скобки.

Вниманию читателя предлагается книга, продолжающая реализацию замысла авторов: создать многотомное справочное пособие по современным математическим методам статистической обработки данных, включающее в себя одновременное освещение необходимого математического аппарата, соответствующего программного обеспечения ЭВМ и рекомендаций по преодолению вычислительных трудностей, связанных с использованием описываемых методов и алгоритмов. Книга адресована специалистам различных сфер человеческой деятельности, использующим методы математической статистики и анализа данных в своей работе.

Для понимания материала книги читателю достаточно обладать математической подготовкой в объеме программ экономического или технического вуза либо ознакомиться с базовыми понятиями теории вероятностей и математической статистики, описанными в первом томе справочного издания . В свою очередь освоение материала предлагаемой книги может служить надежной и удобной базой для более глубокого проникновения в предмет исследования, основанного на изучении специальных монографий и журнальных статей.

Тема книги, бесспорно, центральная во всем справочном издании. Она является таковой как по глубине и разнообразию разработанного к настоящему времени математического аппарата, так и по удельному весу использования описываемых методов и моделей в практических разработках разнообразного профиля.

Главная цель, которую ставили перед собой автоы - оснастить исследователя, использующего в своей работе статистические методы, инструментарием, необходимым для решения ключевой проблемы всякого исследования: как на основании частных результатов статистического наблюдения за анализируемыми событиями или показателями выявить и описать существующие между ними взаимосвязи. Именно эта проблема, проблема статистического исследования зависимостей, оказывается главной в решении таких типовых задач практики, как нормирование, прогноз, планирование, диагностика, оценка труднодоступных для непосредственного наблюдения и измерения характеристик анализируемой системы, оценка эффективности функционирования или качества объекта, регулирование параметров процесса или системы.

Авторы стремились к объективно сбалансированному представлению материала как по структуре книги, так и по ее содержанию. Однако широта и разноплановость затронутой проблемы не позволяют им претендовать на всеобъемлющий охват темы. Так, например, относительно узко представлена в данном томе тематика статистического анализа динамических зависимостей; не дано описания весьма полезного, в определенных типах задач, аппарата логических решающих правил; не вошел в книгу материал, посвященный актуальной в прикладном плане (особенно в задачах управления технологическими процессами) тематике планирования регрессионных экспериментов.

Книга состоит из введения и четырех разделов.

Введение играет особую роль в понимании описываемых в дальнейшем методов и логики всей книги в целом. Можно сказать, что в нем в доступной для неискушенного читателя форме представлены содержание и логические связи всех частей книги. Приводятся основные постановки задач и «адреса» (в книге) их решения. Изложение проиллюстрировано простыми примерами. Поэтому сравнительно слабо подготовленному читателю рекомендуем не пожалеть времени на чтение введения.

Раздел I посвящен методам и приемам, позволяющим ответить на вопросы, имеется ли вообще какая-либо связь между исследуемыми переменными, как измерить их тесноту и какова структура связей между показателями исследуемого набора? При этом под структурой понимается характер всевозможных попарных двоичных взаимоотношений рассматриваемых признаков (по типу «связь есть» или «связи нет»), но не форма зависимости одного от другого. Методы, описанные в данном разделе, составляют содержание корреляционного анализа.

Раздел II содержит описание методов и моделей, позволяющих исследовать вид зависимости интересующего нас «выходного» (или «результирующего») количественного показателя от набора объясняющих переменных количественной природы (регрессионный анализ). В отдельной главе (гл. 12) рассмотрен случай, когда роль объясняющей переменной играет «время».

В разделе III решаются те же задачи, что и в разделе II, но в ситуации, когда в качестве объясняющих переменных выступают неколичественные или одновременно неколичественные и количественные признаки (дисперсионный и ковариационный анализ).

И наконец, в раздел IV включены глава, посвященная описанию методов статистического анализа так называемых систем одновременных эконометрических уравнений (т. е. набора одновременно выполняющихся соотношений, в которых одни и те же переменные могут участвовать в разных соотношениях: и в роли результирующего показателя, и в роли предсказывающей переменной), и глава, в которой дается обзор наиболее интересного отечественного и зарубежного программного обеспечения методов статистического исследования зависимостей.

Читается : 1-2 модуль 3 курса
Пререквизиты : Методы предварительного статистического анализа или знание статистики на базовом уровне
Трудоемкость : 5 кредитов

76 аудиторных часов:

  • 28 часов лекций;
  • 48 часов практических занятий.

Формы контроля:

  • экзамен;
  • 2 домашних задания


Преподаватели

О курсе

Методы анализа вида зависимости и степени взаимосвязи между переменными широко применяются в различных областях прикладных статистических исследований.
В курсе рассмотрены методы корреляционного анализа для оценки наличия и степени статистической взаимосвязи между признаками различной природы, определения структуры связи. В разделе регрессионного анализа рассмотрены проблемы оценивания и проверки значимости параметров линейных и нелинейных регрессионных моделей, регрессионных моделей с переменной структурой, моделей типологической регрессии и бинарного выбора, систем одновременных уравнений. Моделирование зависимостей иллюстрируется примерами, основанными на реальных данных.

Полученные по курсу знания и навыки позволят решать широкий круг задач для создания информационной основы для принятия решений в различных областях знаний и практической деятельности.

Книга логически завершает справочные издания «Прикладная статистика: Основы моделирования и первичная обработка данных» (1983 г.) и «Прикладная статистика: Исследование зависимостей» (1985 г.). Рассматриваются задачи классификации объектов, снижения размерности. Большое внимание уделяется разведочному статистическому анализу.
Для специалистов, применяющих методы анализа данных.

Эффект существенной многомерности.
Сущность этого принципа в том, что выводы, получаемые в результате анализа и классификации множества статистически обследованных (по ряду свойств) объектов, должны опираться одновременно на совокупность этих взаимосвязанных свойств с обязательным учетом структуры и характера их связей. В 15] природа эффекта существенной многомерности поясняется на таком примере: попытка различить два типа потребительского поведения семей, основанная на последовательном применении критерия однородности Стьюдента 112, п. 11.2.81 сначала по одному признаку (удельные расходы на питание), потом по другому (удельные расходы на промышленные товары и услуги) не дала результата, в то время как многомерный аналог этого критерия , основанный на так называемом расстоянии Махаланобиса и учитывающий одновременно значения обоих упомянутых признаков и характер статистической связи между ними, дает правильный результат (т. е. обнаруживает статистически значимое различие между двумя анализируемыми совокупностями семей). Формулировку существа этого принципа мы находим уже в упомянутой работе В. И. Ленина .

Возражая против классификации крестьянских хозяйств изолированно по каждому из анализируемых признаков с ориентацией на их средние значения, он пишет : «Признаки для различения этих типов должны быть взяты сообразно с местными условиями и формами земледелия; если при экстенсивном зерновом хозяйстве можно ограничиться группировкой по посеву (или по рабочему скоту), то при других условиях необходимо принять в расчет посев промышленных растений, техническую обработку сельскохозяйственных продуктов, посев корнеплодов или кормовых трав, молочное хозяйство, огородничество и т. д.


Бесплатно скачать электронную книгу в удобном формате, смотреть и читать:
Скачать книгу Прикладная статистика, Классификации и снижение размерности, Айвазян С.А., Бухштабер В.М., Енюков И.С., Мешалкин Л.Д., 1989 - fileskachat.com, быстрое и бесплатное скачивание.

  • Прикладная статистика, Основы моделирования и первичная обработка данных, Айвазян С.А., Енюков И.С., Мешалкин Л.Д., 1983

Изучение зависимостей – основной род занятий экспериментаторов в любой области знаний. Исследуемый объект, особенно такой сложный как биологический, невозможно изучать целиком. Приходится выделять в нем определенные причинно-следственные связи, которые и формализуются в виде зависимостей. Изучаются зависимости следствий от причин или зависимости между несколькими следствиями, обусловленными общей причиной.

Частным случаем является зависимость какого-либо атрибута объекта от времени – изучению таких зависимостей была посвящена глава 7. В этой (восьмой) главе, напротив, будут рассматриваться преимущественно статические зависимости, в описании которых время не участвует, и все равно предмет этой главы чрезвычайно обширен. Ввиду ограниченного объема курса придется представить только “скелет” рассматриваемой темы. Остается надеяться, что читатели освоят конкретные вопросы изучения зависимостей в ходе собственной исследовательской работы, используя обширную литературу по различным аспектам этой сложной задачи, а также имеющееся программное обеспечение.

Непосредственно рассматриваемой теме посвящено, например, основательное справочное издание , сложное для первоначального знакомства. Более простым источником может послужить учебное пособие . Совсем просто и коротко, в прикладном плане рассмотрены вопросы исследования зависимостей в брошюре . Современные методы обработки экспериментальных данных изложены в монографии . Однако, наряду со сложными статистическими методами анализа и обработки данных, во многих случаях полезны методы наглядного “разведочного анализа” , которые не будут здесь рассматриваться, хотя о них, конечно, тоже не следует забывать.

8.2. Общая структура эксперимента по исследованию зависимостей

При общей постановке задачи исследования зависимостей предполагается (рис. 8.1), что на исследуемый объект воздействует множество факторов (в предыдущей главе почти в том же смысле использовался термин стимул ), а результатом этого воздействия является отклик , в общем случае тоже многокомпонентный. Среди параметров, характеризующих компоненты воздействия и отклика, вообще говоря, могут быть и количественные, и порядковые, и классификационные, причем, конечно, типы используемых шкал сильно влияют на методику проведения эксперимента и обработки данных.

Некоторая часть факторов (точнее – параметров факторов, но в дальнейшем за строгостью выражений не будем следить) может быть задана или измерена; значения других обычно остаются неизвестными – они вносят неопределенность в реакции объекта на изменения контролируемых факторов. К этой неопределенности добавляется еще и неопределенность измерения (или классифицирования) компонентов отклика. Поведение самого объекта тоже не обязано быть полностью детерминированным. Все это приводит к необходимости широко использовать методы математической статистики.

Таким образом, можно сказать, что математический аппарат исследования зависимостей нацелен на решение проблемы: как на основании частных результатов статистического наблюдения анализируемых событий выявить и описать существующие между ними стохастические (вероятностные) связи.

Для сокращения формул при исследовании зависимостей можно рассматривать независимые (“предикторные”) переменные x 1 x k как компоненты вектора x , а зависимые переменные y 1 y m – как компоненты вектора y . Довольно часто можно ограничиться исследованием зависимости одной переменной y от k компонентов вектора x (или рассматривать y 1 y m по отдельности, как бы разбивая единый эксперимент на m частных экспериментов).


Top