Денис Соломатин - mixOmics для гуманитариев

Название:	mixOmics для гуманитариев
Автор:	Денис Соломатин
Жанры:	Программы \| Прочая образовательная литература \| Практикумы
Серии:	Нет данных
ISBN:	Нет данных
Год:	2021

О чем книга "mixOmics для гуманитариев"

Тематика посвященного основам статистической обработки педагогической информации учебного пособия оказалась на редкость востребованной и актуальной, что послужило стимулом к написанию продолжения. Учебное пособие предназначено для бакалавров, обучающихся по направлению подготовки «Математическое образование» интересы которых лежат в области статистической обработки социальной и педагогической информации. Из отличительных особенностей R хорош тем, что бесплатен и установлен на серверах Google Cloud и ИМ СО РАН, а значит позволяет задействовать вычислительную мощь современных суперкомпьютеров. Кроме того, статистический анализ большого числа переменных на сегодняшний день лучше всего реализован в его дополнительном пакете mixOmics, а в современных реалиях R позволяет неподготовленному читателю разворачивать веб-сервер для решения задач собственной онлайн-школы, на открытие которой всё больше нас вдохновляют современные реалии.

Бесплатно читать онлайн mixOmics для гуманитариев

Введение

«Живые смыслы не оцифровать», тем не менее, реалии цифровой эпохи таковы, что всё настойчивее стремимся вникнуть в тайны мироздания пользуясь предоставляемым математикой инструментарием и описать увиденное на языке цифр. Само по себе это не хорошо и не плохо, не стоит лишь забывать и об эмоциональной, чувственной составляющей жизни человека. В связи со сказанным на передний план выходят различные «омики», изучающие то всеобъемлющее, что буквально создаёт нас, формируя основу нашей жизни. В частности, например: геном – как совокупность данных обо всех наших генах; транскриптом – постоянно меняющийся набор считываемых из генома данных; протеом – все производимые нашим организмом белки; эпигеном – условия, в которых живёт организм, формирующие своеобразный регуляторный уровень над генами; микробиом – бактерии, с которыми мы живём; метагеном – совокупный геном сообщества организмов, живущих вместе; коннектом – совокупность нервных связей живого организма; социом – как совокупность социальных связей индивида. Созданием в определённом смысле этого слова новых членов общества занимается и система образования, именно поэтому на наш взгляд оказывается уместным в ходе статистической обработки педагогической информации использование mixOmics – пакета прикладных программ, функций и процедур R, разрабатываемого и поддерживаемого отделением математики и статистики Мельбурнского университета (Австралия), а также Институтом математики Университета Тулузы (Франция), с передовыми достижениями которых можно ознакомиться на сайте http://mixomics.org

В фундаментальной работе Грабарь М. И., Краснянская К. А. (Применение математической статистики и педагогических исследованиях. Непараметрические методы. М., «Педагогика», 1977. 136 с. с ил. Науч.-исслед. ин-т содержания и методов обучения Акад. пед. наук СССР), на стр.4 констатировали печальный факт: «Любое изложение общей теории проверки статистических гипотез неизбежно должно предполагать у читатели очень серьезную математическую подготовку, каковой, к сожалению, не обладают большинство исследователей-педагогов». С наступлением цифровой эпохи и распространением доступных инструментальных средств статистической обработки информации отмеченный недостаток можно нивелировать и обратить в достоинство. Предполагается, что читатель уже знаком с изложенными в предыдущей части настоящего пособия азами работы R, – языка программирования для статистической обработки данных и работы с графикой, а также свободной программной среды вычислений с открытым исходным кодом в рамках проекта GNU. Поэтому во второй части сконцентрируемся на использовании ключевых функций пакета mixOmics для анализа педагогических данных. Если возникнут какие-либо проблемы с пониманием излагаемого материала, настоятельно рекомендуется вернуться и перечитать предыдущую часть пособия. Выбранный набор инструментов включает в себя многовариантные методы статистического анализа, предпочтение которым отдаётся в зависимости от обрабатываемых или собираемых педагогических данных, например, с целью апробации результатов, дискриминантного анализа, слияния двух или более наборов данных. mixOmics – это набор инструментов R, посвященный исследованию и слиянию различных наборов данных с определенным акцентом на выборе переменных. Пакет в настоящее время включает в себя порядка двадцати многовариантных методов. Первоначально все методы были разработаны для данных «омиков», однако их применение не ограничивается только такими данными. Другие приложения возникают как правило в тех случаях, когда переменные-предикторы (то есть переменные, по значениям которых составляются прогнозы) непрерывны.

В пакете mixOmics, сильный акцент делается на графическое представление, чтобы лучше интерпретировать и понять отношения между различными типами данных визуализируют структуру корреляции как на выборочных значениях, так и на шкале интервалов. А начинается использование рассматриваемого пакета со ввода данных. Напомним блок-схему основного алгоритма статистической обработки педагогических и социальных данных, концептуально выкристаллизовавшегося к концу предыдущей части книги:

Как видим, обработка начинается со ввода данных, их предварительного импортирования и очистки. К предварительной обработке данных перед анализом данных с помощью mixOmics предъявляются следующие требования:

Различные типы педагогических данных могут быть изучены и интегрированы с mixOmics. Методы могут обрабатывать показатели успеваемости, измеренные в непрерывном масштабе или полученные на основе данных подсчета, которые становятся непрерывными данными после предварительной обработки и нормализации.

Пакет mixOmics не справляется с нормализацией, так как он универсален и охватывает широкий спектр данных. До начала анализа предполагается, что наборы данных были нормализованы с использованием соответствующих методов нормализации педагогических данных и предварительно обработаны, когда это возможно.

В то время как методы mixOmics могут обрабатывать большие массивы данных (несколько десятков тысяч переменных-предикторов), рекомендуется предварительно фильтровать данные до менее чем 10 000 переменных-предикторов на набор данных, например, с помощью медианного абсолютного отклонения, удалив пренебрежимо малые значения в наборах данных или путем удаления предикторов почти нулевой дисперсии. Такой шаг направлен на уменьшение вычислительного времени в процессе настройки параметров.

Методы mixOmics используют разложения матриц. Таким образом, числовая матрица данных или фреймы данных имеют n наблюдений или образцов в строках и p предикторов или переменных в столбцах.

В текущей версии mixOmics, ковариации, которые могут запутать анализ не включены в методы статистического анализа. Рекомендуется корректировать наборы этих ковариаций заранее, используя соответствующие унивариантные или многовариантные методы для удаления информационного шума.

Перечислим теперь основные методологические и теоретические основы, которые необходимо знать, чтобы эффективно применять mixOmics:

• Индивидуальные наблюдения или образцы: экспериментальные группы, на которых собиралась информация, например, обучающиеся, студенты, олимпиадные задания и прочее.

• Переменные, предикторы: считываемые измерения на каждом образце, например, успеваемость, посещаемость, решаемость задач, творческая самореализация и так далее.

• Дисперсия: измеряет уровень распылённости одной переменной. Как правило оценивается дисперсия целых компонентов, а не считываемых переменных. Высокая дисперсия указывает на то, что точки данных очень отличаются от среднего, и друг от друга (разбросаны).

Следующая страница

С этой книгой читают

Математические модели в естественнонаучном образовании. Том I

Денис Соломатин

Начало XXI века ознаменовано выходом в свет прекрасной книги Mathematical Models in Biology An Introduction / Elizabeth S. Allman, University of Southern Maine, John A. Rhodes, Bates College, Maine, содержащей обзор достижений века предшествующего, которая легла в основу данного издания, поэтому если уже знакомы с ней, то мне вас практически нечем удивить. В противном случае – добро пожаловать в чудесный мир тесного переплетения идей биологии, кр

Читать

Основы статистической обработки педагогической информации

Денис Соломатин

Учебное пособие содержит текстовые сведения, иллюстрации и задания по основам статистической обработки педагогической информации в R, вольный пересказ содержимого сайта r4ds.had.co.nz, многие годы аккумулирующего труды исследователей всего мира, с занимательными дополнениями и историческими справками в попытке адаптации материала под профессиональные нужды современных онлайн-учителей. Последняя глава посвящена изучению возможностей R, позволяющих

Читать

Математические модели в естественнонаучном образовании. Том II

Денис Соломатин

Читать

Excel. Трюки и эффекты

Алексей Анатольевич Гладкий Александр Анатольевич Чиртик

Данная книга предназначена для пользователей Microsoft Excel и содержит описание приемов и методов работы, которые из-за своей специфичности недостаточно представлены (либо вообще не представлены) в пользовательской, справочной и иной соответствующей документации. Изучение приведенных в книге примеров позволит читателю открыть для себя не известные ранее возможности Excel. Предлагаемый материал легко усваивается благодаря тому, что излагается дос

Читать

Секреты компьютерного дизайна

Сергей Погорелый

Вы хотите попробовать свои силы в компьютерной графике и создать в растровом редакторе Photoshop красивый монтаж? У вас есть все составляющие для собственной работы, но ничего не получается? Не унывайте! Эта книга даст вам шанс и поможет научиться создавать удивительные изображения.Автор, известный специалист в области фотомонтажа и компьютерного дизайна, в легкой и доступной форме познакомит вас с историей появления и становления фотомонтажа как

Читать

Тестируй, а не гадай: Как проводить А/В-тесты правильно

Артем Демиденко

Хотите принимать решения на основе данных, а не интуиции? Книга «Тестируй, а не гадай: Как проводить А/В-тесты правильно» станет вашим надёжным гидом в мире экспериментов! Вы узнаете, как превращать гипотезы в точные данные, избегать распространённых ошибок и грамотно интерпретировать результаты. Автор шаг за шагом объясняет принципы планирования и проведения А/В-тестов, раскрывает секреты успешного анализа и помогает найти правильные метрики для

Читать

GraphRAG в когнитивном программировании корпоративного сознания – внедряем Neo4j и Cypher

Лэй Энстазия

Эта книга – руководство по использованию графовых технологий и когнитивного программирования в корпоративной среде. Она охватывает эволюцию графовых баз данных, принципы работы Neo4j и языка запросов Cypher, а также концепцию GraphRAG – инновационного подхода к обработке знаний на основе графов. Читатель познакомится с основами моделирования корпоративного сознания, интеграцией когнитивных методов с графовыми структурами и их влиянием на бизнес-р

Читать

Веритофобия

Михаил Веллер

Название новой книги Михаила ВЕЛЛЕРА «ВЕРИТОФОБИЯ» поясняется в первых ее строках: «Ужас правды, неумение видеть правду, нежелание знать ее». Она о том, как с детства нам ловко и радостно мешают видеть мир собственными глазами и иметь собственные мысли. Это и судьба нынешнего поколения, и секреты Советского Союза, и скандальные страницы русской культуры. Автор разоблачает ложь гомосексуализма, громит политкорректность и предупреждает об апокалипс

Читать

Метро 2033: Край земли. Затерянный рай

Сурен Цормудян

«Метро 2033» – Дмитрия Глуховского – культовый фантастический роман, самая обсуждаемая российская книга последних лет. Тираж – полмиллиона, переводы на десятки языков плюс грандиозная компьютерная игра! Эта постапокалиптическая история вдохновила целую плеяду современных писателей, и теперь они вместе создают Вселенную «Метро 2033», серию книг по мотивам знаменитого романа. Герои этих новых историй наконец-то выйдут за пределы Московского метро.

Читать

Вспять. Сборник стихотворений

Сергей Ананьев

Духовные искания, мысли о прошлом и будущем, неоднородность ландшафтов – всё это укладывается в сборнике «Вспять», который включает в себя философскую, пейзажную и любовную лирику, что подчеркивается его трёхчастной структурой и наличием катренов-интерлюдий. Сборник «Вспять» предлагает современному читателю отправиться к его островам и проникнуться особым колоритом каждого из них.

Читать

Я сделаю вам предложение, от которого нельзя отказаться

Майкл Францезе

Один из самых состоятельных мафиози передает свой уникальный опыт и учит предпринимателей – от менеджеров крупнейших корпораций до владельцев небольших компаний – максимально использовать потенциал своего бизнеса.Для широкого круга читателей.В формате a4.pdf сохранен издательский макет.

Читать