Предлагаю задачу, которую я даю студентам в курсе Анализ данных. Задача открытая, так что для нее нет единственно верного решения. Прошу желающих предлагать свои варианты, по-возможности нетривиальные. Дана таблица результатов ЕГЭ по школе (району, городу, области и т.д.). Результаты даны по всем предметам, с привязкой к каждому ученику (его идентификатору). PS. Жаль, что эти данные недоступны на практике (думаю, там много замешано интересов). задан 18 Янв '13 23:02 DocentI |
Мне кажется, это прекрасная возможность найти корреляции между предметами. Например, как коррелируют между собой физика и математика? Имеется ли статистическая зависимость между оценками успеваемости по одному предмету и оценками по другому? Результаты каждого ученика можно представить в виде точки с координатами $%\left(Оценка_1;Оценка_2\right)$%. Для всей совокупности получаем корреляционное поле, уже по одному характеру которого можно визуально оценить наличие корреляции. Найденные зависимости можно использовать для выявления баланса нагрузки на учеников при составлении (дополнении или сокращении) программ в школе, причём масштаб может касаться как отдельной школы, так и всей школьной программы. Например, если математика хорошо коррелирует с физикой, а в успеваемости по биологии имеется конкретный провал, и при этом биология лучше коррелирует с математикой, чем с физикой, то для выравнивания успеваемости возможно уменьшение количества часов физики в пользу биологии. То же самое при изменении объёма программы отдельного предмета: можно жертвовать часами того предмета, по которому неплохая успеваемость, и он коррелирует с минимумом предметов (его урезание не приведёт к ухудшению общей картины). отвечен 23 Янв '13 17:48 АлекСт 1
Общая направленность мне нравится, хотя я бы поостереглась с выводами. Кроме корреляции можно использовать также методы кластеризации, чтобы выявить группы схожих предметов. Или , скажем, учеников. Интересно, совпадет ли такая классификация со стандартным разделением на гуманитариев и естественников?
(23 Янв '13 20:51)
DocentI
Ну это да, заносит, бывает.
Тоже интересно )
(23 Янв '13 21:18)
АлекСт
Вот бы реально такую таблицу получить!
(23 Янв '13 21:38)
chameleon
На днях у нас республиканская олимпиада, там будут и представители министерства. Попробую прозондировать почву. В конце концов, это можно оформить как курсовую или дипломную работу. Мы сейчас как раз набрали магистров по специализации "Анализ данных".
(24 Янв '13 11:50)
DocentI
Скажем так: как есть никто эту базу не даст. А вот без имен и названий, оставив только id-шники учеников/школ/городов - вполне возможно.
(24 Янв '13 13:56)
chameleon
Ну так естественно, к чему имена? :)
(25 Янв '13 23:39)
АлекСт
показано 5 из 7
показать еще 2
|
Не знаю насчет нетривиальных, но такие "исследования", как формирование отчетов успеваемости учеников/классов/школ/.../областей, сами напрашиваются. Методы? Сортировка! отвечен 19 Янв '13 2:48 chameleon Неплохо, хотя есть пара возражений. Во-первых, не очень понятно, как искать "поддельные" ЕГЭ.возможно, надо составить "типичный" профиль и сравнивать с ним. И еще. Указанные методы применяются по сути к каждому предмету отдельно. То, что один и тот же ученик сдает разные предметы, не учтено. Тут еще много возможностей.
(19 Янв '13 3:40)
DocentI
Да тут можно придумать смысл любой случайно взятой групповой функции на таблицах данных :)
(19 Янв '13 9:56)
chameleon
? Это типа шутка, что ли? Юмор - это хорошо, но пока придать вопрос не буду.
(19 Янв '13 12:24)
DocentI
Да, шутка, но в ней доля правды.
(19 Янв '13 13:17)
chameleon
|