Несколько лет назад, когда каталог Степика был совсем другим, да и поиск не сильно радовал, задался я целью найти все курсы, которые есть на этой площадке. Для чего набросал на коленке парсер.
Не мудрствуя лукаво, я определил два важных критерия для автоматизации процесса. Первый — название курса. Если названия нет, значит и курса по адресу либо нет, либо доступ к нему закрыт. Второй — количество учащихся. Чтобы можно было отсеять разные курсы-пустышки.
Парсер написан на python и выложен на github`е. Там еще есть что доделать и переделать. Однако им можно пользоваться. Думаю особо полезен он может быть для тех, кто активно учится на Степике.
Так или иначе, скачать (или посмотреть ужасный исходный код) его можно здесь:
https://github.com/IgorLutiy/stepik_title_parser
Надеюсь, когда-нибудь дойдут руки выложить скрипт по работе с API Степика, который я использую для публикации топ-100 по знаниям и топ-100 по репутации. Но хочется привести его в надлежащий вид, чтобы было не совсем стыдно.