Денис Соломатин - mixOmics для гуманитариев

mixOmics для гуманитариев
Название: mixOmics для гуманитариев
Автор:
Жанры: Программы | Прочая образовательная литература | Практикумы
Серии: Нет данных
ISBN: Нет данных
Год: 2021
О чем книга "mixOmics для гуманитариев"

Тематика посвященного основам статистической обработки педагогической информации учебного пособия оказалась на редкость востребованной и актуальной, что послужило стимулом к написанию продолжения. Учебное пособие предназначено для бакалавров, обучающихся по направлению подготовки «Математическое образование» интересы которых лежат в области статистической обработки социальной и педагогической информации. Из отличительных особенностей R хорош тем, что бесплатен и установлен на серверах Google Cloud и ИМ СО РАН, а значит позволяет задействовать вычислительную мощь современных суперкомпьютеров. Кроме того, статистический анализ большого числа переменных на сегодняшний день лучше всего реализован в его дополнительном пакете mixOmics, а в современных реалиях R позволяет неподготовленному читателю разворачивать веб-сервер для решения задач собственной онлайн-школы, на открытие которой всё больше нас вдохновляют современные реалии.

Бесплатно читать онлайн mixOmics для гуманитариев


Введение

«Живые смыслы не оцифровать», тем не менее, реалии цифровой эпохи таковы, что всё настойчивее стремимся вникнуть в тайны мироздания пользуясь предоставляемым математикой инструментарием и описать увиденное на языке цифр. Само по себе это не хорошо и не плохо, не стоит лишь забывать и об эмоциональной, чувственной составляющей жизни человека. В связи со сказанным на передний план выходят различные «омики», изучающие то всеобъемлющее, что буквально создаёт нас, формируя основу нашей жизни. В частности, например: геном – как совокупность данных обо всех наших генах; транскриптом – постоянно меняющийся набор считываемых из генома данных; протеом – все производимые нашим организмом белки; эпигеном – условия, в которых живёт организм, формирующие своеобразный регуляторный уровень над генами; микробиом – бактерии, с которыми мы живём; метагеном – совокупный геном сообщества организмов, живущих вместе; коннектом – совокупность нервных связей живого организма; социом – как совокупность социальных связей индивида. Созданием в определённом смысле этого слова новых членов общества занимается и система образования, именно поэтому на наш взгляд оказывается уместным в ходе статистической обработки педагогической информации использование mixOmics – пакета прикладных программ, функций и процедур R, разрабатываемого и поддерживаемого отделением математики и статистики Мельбурнского университета (Австралия), а также Институтом математики Университета Тулузы (Франция), с передовыми достижениями которых можно ознакомиться на сайте http://mixomics.org

В фундаментальной работе Грабарь М. И., Краснянская К. А. (Применение математической статистики и педагогических исследованиях. Непараметрические методы. М., «Педагогика», 1977. 136 с. с ил. Науч.-исслед. ин-т содержания и методов обучения Акад. пед. наук СССР), на стр.4 констатировали печальный факт: «Любое изложение общей теории проверки статистических гипотез неизбежно должно предполагать у читатели очень серьезную математическую подготовку, каковой, к сожалению, не обладают большинство исследователей-педагогов». С наступлением цифровой эпохи и распространением доступных инструментальных средств статистической обработки информации отмеченный недостаток можно нивелировать и обратить в достоинство. Предполагается, что читатель уже знаком с изложенными в предыдущей части настоящего пособия азами работы R, – языка программирования для статистической обработки данных и работы с графикой, а также свободной программной среды вычислений с открытым исходным кодом в рамках проекта GNU. Поэтому во второй части сконцентрируемся на использовании ключевых функций пакета mixOmics для анализа педагогических данных. Если возникнут какие-либо проблемы с пониманием излагаемого материала, настоятельно рекомендуется вернуться и перечитать предыдущую часть пособия. Выбранный набор инструментов включает в себя многовариантные методы статистического анализа, предпочтение которым отдаётся в зависимости от обрабатываемых или собираемых педагогических данных, например, с целью апробации результатов, дискриминантного анализа, слияния двух или более наборов данных. mixOmics – это набор инструментов R, посвященный исследованию и слиянию различных наборов данных с определенным акцентом на выборе переменных. Пакет в настоящее время включает в себя порядка двадцати многовариантных методов. Первоначально все методы были разработаны для данных «омиков», однако их применение не ограничивается только такими данными. Другие приложения возникают как правило в тех случаях, когда переменные-предикторы (то есть переменные, по значениям которых составляются прогнозы) непрерывны.

В пакете mixOmics, сильный акцент делается на графическое представление, чтобы лучше интерпретировать и понять отношения между различными типами данных визуализируют структуру корреляции как на выборочных значениях, так и на шкале интервалов. А начинается использование рассматриваемого пакета со ввода данных. Напомним блок-схему основного алгоритма статистической обработки педагогических и социальных данных, концептуально выкристаллизовавшегося к концу предыдущей части книги:



Как видим, обработка начинается со ввода данных, их предварительного импортирования и очистки. К предварительной обработке данных перед анализом данных с помощью mixOmics предъявляются следующие требования:

Различные типы педагогических данных могут быть изучены и интегрированы с mixOmics. Методы могут обрабатывать показатели успеваемости, измеренные в непрерывном масштабе или полученные на основе данных подсчета, которые становятся непрерывными данными после предварительной обработки и нормализации.

Пакет mixOmics не справляется с нормализацией, так как он универсален и охватывает широкий спектр данных. До начала анализа предполагается, что наборы данных были нормализованы с использованием соответствующих методов нормализации педагогических данных и предварительно обработаны, когда это возможно.

В то время как методы mixOmics могут обрабатывать большие массивы данных (несколько десятков тысяч переменных-предикторов), рекомендуется предварительно фильтровать данные до менее чем 10 000 переменных-предикторов на набор данных, например, с помощью медианного абсолютного отклонения, удалив пренебрежимо малые значения в наборах данных или путем удаления предикторов почти нулевой дисперсии. Такой шаг направлен на уменьшение вычислительного времени в процессе настройки параметров.

Методы mixOmics используют разложения матриц. Таким образом, числовая матрица данных или фреймы данных имеют n наблюдений или образцов в строках и p предикторов или переменных в столбцах.

В текущей версии mixOmics, ковариации, которые могут запутать анализ не включены в методы статистического анализа. Рекомендуется корректировать наборы этих ковариаций заранее, используя соответствующие унивариантные или многовариантные методы для удаления информационного шума.

Перечислим теперь основные методологические и теоретические основы, которые необходимо знать, чтобы эффективно применять mixOmics:

•             Индивидуальные наблюдения или образцы: экспериментальные группы, на которых собиралась информация, например, обучающиеся, студенты, олимпиадные задания и прочее.

•             Переменные, предикторы: считываемые измерения на каждом образце, например, успеваемость, посещаемость, решаемость задач, творческая самореализация и так далее.

•             Дисперсия: измеряет уровень распылённости одной переменной. Как правило оценивается дисперсия целых компонентов, а не считываемых переменных. Высокая дисперсия указывает на то, что точки данных очень отличаются от среднего, и друг от друга (разбросаны).


С этой книгой читают
Начало XXI века ознаменовано выходом в свет прекрасной книги Mathematical Models in Biology An Introduction / Elizabeth S. Allman, University of Southern Maine, John A. Rhodes, Bates College, Maine, содержащей обзор достижений века предшествующего, которая легла в основу данного издания, поэтому если уже знакомы с ней, то мне вас практически нечем удивить. В противном случае – добро пожаловать в чудесный мир тесного переплетения идей биологии, кр
Начало XXI века ознаменовано выходом в свет прекрасной книги Mathematical Models in Biology An Introduction / Elizabeth S. Allman, University of Southern Maine, John A. Rhodes, Bates College, Maine, содержащей обзор достижений века предшествующего, которая легла в основу данного издания, поэтому если уже знакомы с ней, то мне вас практически нечем удивить. В противном случае – добро пожаловать в чудесный мир тесного переплетения идей биологии, кр
Учебное пособие содержит текстовые сведения, иллюстрации и задания по основам статистической обработки педагогической информации в R, вольный пересказ содержимого сайта r4ds.had.co.nz, многие годы аккумулирующего труды исследователей всего мира, с занимательными дополнениями и историческими справками в попытке адаптации материала под профессиональные нужды современных онлайн-учителей. Последняя глава посвящена изучению возможностей R, позволяющих
Данная книга – своеобразная «скорая помощь» для новичков, которым нужно быстро разобраться с возможностями новой версии текстового процессора Mirosoft Word 2007. Кроме того, это полезное пособие для более опытных пользователей – с его помощью они смогут быстрее освоить новый интерфейс программы. В книге нет слишком подробных описаний, не рассматриваются экзотические возможности приложения. Ее основная цель – помочь вам за несколько минут найти от
Не секрет, что любая безупречно оформленная письменная работа всегда претендует на более высокую оценку. Если вы хотите научиться быстро и качественно оформлять рефераты и курсовые работы, эта книга станет для вас незаменимым помощником. Поиск нужной информации в Интернете, быстрый набор, сканирование и форматирование текстов, создание сложных математических формул и качественных иллюстраций больше не будут казаться чем-то чрезвычайно сложным и н
Когда-нибудь на любом компьютере неизбежно накапливается большое количество информации. Прочитав эту книгу, вы научитесь переносить ваши данные на компакт-диски или DVD, узнаете, как создавать диски с данными, музыкальные диски, DVD со всеми атрибутами. Если у вас скопилось большое количество аудио– и видеокассет со старыми записями, эта книга расскажет, как перенести их на цифровой носитель. Вы научитесь создавать этикетки для дисков, работать с
Современный бухгалтер немыслим без компьютера и бухгалтерских компьютерных программ, помогающих оформить платежные документы, приходные и расходные кассовые ордера, вести учет поступления и движения товаров, выписывать счета-фактуры и многое, многое другое. В книге подробно рассматриваются специализированные бухгалтерские программы «1С: Предприятие», 7.7 и 8.0, а также редактор электронных таблиц Microsoft Excel, приводятся конкретные примеры их
Название новой книги Михаила ВЕЛЛЕРА «ВЕРИТОФОБИЯ» поясняется в первых ее строках: «Ужас правды, неумение видеть правду, нежелание знать ее». Она о том, как с детства нам ловко и радостно мешают видеть мир собственными глазами и иметь собственные мысли. Это и судьба нынешнего поколения, и секреты Советского Союза, и скандальные страницы русской культуры. Автор разоблачает ложь гомосексуализма, громит политкорректность и предупреждает об апокалипс
«Метро 2033» – Дмитрия Глуховского – культовый фантастический роман, самая обсуждаемая российская книга последних лет. Тираж – полмиллиона, переводы на десятки языков плюс грандиозная компьютерная игра! Эта постапокалиптическая история вдохновила целую плеяду современных писателей, и теперь они вместе создают Вселенную «Метро 2033», серию книг по мотивам знаменитого романа. Герои этих новых историй наконец-то выйдут за пределы Московского метро.
Эльфы в нашей вселенной - большая редкость. Ну кто же знал, что мне, как обычно, подфартит: в очередной экспедиции меня будут сопровождать сразу два.
Недавно я была свободной морской разбойницей, а теперь - губернатор прибрежного города и знатная рабовладелица. Иметь в своём распоряжении табун мужчин оказалось не таким уж весёлым занятием - хоть каждый по своему хорош в постели, нервов на всех троих не оберёшься...