Кстати, про школьников и ML. Вообще говоря, у...

Кстати, про школьников и ML. Вообще говоря, у меня есть некоторая проблема - как и чему конкретно их учить, есть вопрос.

Во-первых, есть классический путь "лекционного" типа. Вот, ребята, машинное обучение, вот есть алгоритмы, вот так считается ошибка, а вот часть про высшую алгебру придётся вам пропустить, ну максимум можно рассказать теоретически про функцию ошибки и на пальцах объяснить, как работает метод градиентного спуска. Вообще говоря, история довольно унылая, в том плане что не даёт связи с реальностью и скорее отталкивает. Всё-таки в 8 классе это скорее приключение, чем функциональное обучение.

Второй пусть - решаем конкретные задачки, учимся по хожу. Вот готовый датасет, вот простой метод, вот Python Notebook, вот sklearn. Информацию читаем в интернете или выдаём по мере необходимости. Уже гораздо лучше. Интересно, можно рисовать графики. Но всё-таки задачи ставит кто-то другой, данные подготовлены, получается узкий фокус. Разбиваем Iris Dataset, строим простенькие линейные регрессии и т.д., чувствуем, что что-то умеем, берём модели посложнее.

Третье - прыгаем в область максимально близкой к жизни. Т.е. ставим себе реально интересный вопрос, пытаемся на него ответить себе, узнать что-то новое. Выбор методов - открытая тема. В качестве примера - пока осваиваили тип данным dictionary, строили частотные словари произведений с уроков литературы и по ним анализировали тему. Уже такое приблежение к их жизни давало очень классные результаты. Проблема - какие задачи будут школьнику близки? Например, думали про анализ текстов, но поддержка русского языка - нетривиальная тема. А так, казалось бы, классно было пропустить через sentiment analysis, например, собственную переписку и увидеть, как это работает. Да и хорошие корпусы текстов для обучения классификаторов (жанры, sentiment, и т.д.) мне что-то не удалось хорошие найти. А модельки типа word2vec всё-таки сложноваты для них.

В общем, если у кого есть идеи интересных задач или проектов - буду рад, вы очень поможете и мне, и молодым ребятам зацепиться за эту стезю, попробовать возможности ML в реальном деле :)
By the way, about schoolchildren and ML. Generally speaking, I have some problem - how and with what specifically to teach them, is there a question.

Firstly, there is the classic way of the "lecture" type. Here, guys, machine learning, here are the algorithms, this is how an error is considered, but you have to skip the part about higher algebra, well, you can tell a theoretical maximum about the error function and explain how the gradient descent method works on your fingers. Generally speaking, the story is rather dull, in the sense that it does not give a connection with reality and rather repels. Still, in the 8th grade, this is more an adventure than a functional learning.

Let the second one solve the specific problems, learn how to go. Here is a ready dataset, here is a simple method, here is Python Notebook, here is sklearn. We read the information on the Internet or issue it as needed. Already much better. Interestingly, you can draw graphics. But still, the tasks are put by someone else, the data are prepared, a narrow focus is obtained. We divide Iris Dataset, build simple linear regressions, etc., we feel that we can do something, we take models more complicated.

Third, we jump to the area as close to life as possible. Those. we pose a really interesting question for ourselves, we try to answer it ourselves, learn something new. The choice of methods is an open topic. As an example, while they mastered the type of data for the dictionary, they constructed frequency dictionaries of works from literature lessons and analyzed the topic using them. Already such an approach to their life gave very cool results. The problem - what tasks will be close to the student? For example, they thought about text analysis, but the support of the Russian language is not a trivial topic. And so, it would seem cool to pass through sentiment analysis, for example, your own correspondence and see how it works. Yes, and good text corpses for training classifiers (genres, sentiment, etc.) I could not find something good. A model like word2vec still complicated for them.

In general, if anyone has ideas for interesting tasks or projects - I will be glad, you will help me and the young guys to catch hold of this path, try the ML opportunities in real life :)
У записи 5 лайков,
0 репостов.
Эту запись оставил(а) на своей стене Антон Сидельников

Понравилось следующим людям