Предлагаю задачу, которую я даю студентам в курсе Анализ данных. Задача открытая, так что для нее нет единственно верного решения. Прошу желающих предлагать свои варианты, по-возможности нетривиальные.

Дана таблица результатов ЕГЭ по школе (району, городу, области и т.д.). Результаты даны по всем предметам, с привязкой к каждому ученику (его идентификатору).
1. Какие исследования можно провести по этим данным? Какие вопросы поставить?
2. Какие методы можно применить для решения этих задач

PS. Жаль, что эти данные недоступны на практике (думаю, там много замешано интересов).

задан 18 Янв '13 23:02

10|600 символов нужно символов осталось
2

Мне кажется, это прекрасная возможность найти корреляции между предметами. Например, как коррелируют между собой физика и математика? Имеется ли статистическая зависимость между оценками успеваемости по одному предмету и оценками по другому? Результаты каждого ученика можно представить в виде точки с координатами $%\left(Оценка_1;Оценка_2\right)$%. Для всей совокупности получаем корреляционное поле, уже по одному характеру которого можно визуально оценить наличие корреляции. Найденные зависимости можно использовать для выявления баланса нагрузки на учеников при составлении (дополнении или сокращении) программ в школе, причём масштаб может касаться как отдельной школы, так и всей школьной программы. Например, если математика хорошо коррелирует с физикой, а в успеваемости по биологии имеется конкретный провал, и при этом биология лучше коррелирует с математикой, чем с физикой, то для выравнивания успеваемости возможно уменьшение количества часов физики в пользу биологии. То же самое при изменении объёма программы отдельного предмета: можно жертвовать часами того предмета, по которому неплохая успеваемость, и он коррелирует с минимумом предметов (его урезание не приведёт к ухудшению общей картины).

ссылка

отвечен 23 Янв '13 17:48

изменен 23 Янв '13 18:03

1

Общая направленность мне нравится, хотя я бы поостереглась с выводами. Кроме корреляции можно использовать также методы кластеризации, чтобы выявить группы схожих предметов. Или , скажем, учеников. Интересно, совпадет ли такая классификация со стандартным разделением на гуманитариев и естественников?

(23 Янв '13 20:51) DocentI

хотя я бы поостереглась с выводами

Ну это да, заносит, бывает.

Интересно, совпадет ли такая классификация со стандартным разделением на гуманитариев и естественников?

Тоже интересно )

(23 Янв '13 21:18) АлекСт

Вот бы реально такую таблицу получить!

(23 Янв '13 21:38) chameleon

На днях у нас республиканская олимпиада, там будут и представители министерства. Попробую прозондировать почву. В конце концов, это можно оформить как курсовую или дипломную работу. Мы сейчас как раз набрали магистров по специализации "Анализ данных".

(24 Янв '13 11:50) DocentI

@DocentI, покажете результаты, если будут?

(24 Янв '13 13:10) АлекСт

Скажем так: как есть никто эту базу не даст. А вот без имен и названий, оставив только id-шники учеников/школ/городов - вполне возможно.

(24 Янв '13 13:56) chameleon

Ну так естественно, к чему имена? :)

(25 Янв '13 23:39) АлекСт
показано 5 из 7 показать еще 2
10|600 символов нужно символов осталось
0

Не знаю насчет нетривиальных, но такие "исследования", как формирование отчетов успеваемости учеников/классов/школ/.../областей, сами напрашиваются. Методы? Сортировка!
Если есть сведения за несколько лет, то можно попытаться сделать анализ роста общей успеваемости, сделать прогноз на будущее, дать рекомендации по изменению образовательного фонда, в конце концов.
Если есть сведения про то, в каких школах для кого проводились ЕГЭ, то можно поискать школы, в которых, возможно, преподаватели были подкуплены или тому подобное. Например, если в какой-то школе 70% оценок были пятерки, 30% - двойки, а троек и четверок вообще не было, то логично предположить, что что-то тут не так :) Это, конечно, крайний случай, но попытаться найти подобное можно. Метод - статистический анализ. Конкретнее - найти закон распределения оценок и посмотреть, результаты в каких школах резко от него отличаются.
Можно поискать "гениев" - учеников, результаты которых сильно отличаются от результатов их классов (в положительную сторону, естественно).
По мат. ожиданию оценки по предмету можно определить сложность экзамена, чтоб подправить ее к следующему году.

ссылка

отвечен 19 Янв '13 2:48

Неплохо, хотя есть пара возражений. Во-первых, не очень понятно, как искать "поддельные" ЕГЭ.возможно, надо составить "типичный" профиль и сравнивать с ним.

И еще. Указанные методы применяются по сути к каждому предмету отдельно. То, что один и тот же ученик сдает разные предметы, не учтено. Тут еще много возможностей.

(19 Янв '13 3:40) DocentI

Да тут можно придумать смысл любой случайно взятой групповой функции на таблицах данных :)

(19 Янв '13 9:56) chameleon

? Это типа шутка, что ли? Юмор - это хорошо, но пока придать вопрос не буду.

(19 Янв '13 12:24) DocentI

Да, шутка, но в ней доля правды.

(19 Янв '13 13:17) chameleon
10|600 символов нужно символов осталось
Ваш ответ

Если вы не нашли ответ, задайте вопрос.

Здравствуйте

Математика - это совместно редактируемый форум вопросов и ответов для начинающих и опытных математиков, с особенным акцентом на компьютерные науки.

Присоединяйтесь!

отмечен:

×23

задан
18 Янв '13 23:02

показан
1476 раз

обновлен
25 Янв '13 23:39

Отслеживать вопрос

по почте:

Зарегистрировавшись, вы сможете подписаться на любые обновления

по RSS:

Ответы

Ответы и Комментарии

Дизайн сайта/логотип © «Сеть Знаний». Контент распространяется под лицензией cc by-sa 3.0 с обязательным указанием авторства.
Рейтинг@Mail.ru