Найдите людей, с которыми вы хотели бы работать в группе. Создайте группы из 2–3 человек и заполните таблицу в вашей папке с домашими заданиями по примеру ниже.
1. Ваши имена.
2. Общая тематика вашего проекта, может звучать как название
научной области.
3. Конкретная формулировка темы вашего проекта.. Формулировка должна отвечать на традиционные W-вопросы.
- Тема-пример: Гендерное неравенство в мировой литературе с библейских времён до наших дней
- What? — Что? — Гендерное неравенство
- Which scientific field? — Какая научная область? — Литература
- Where? — Где? — Во всём мире (также можно выбрать конкретную страну, город и т.д.)
- When? — Когда? — с библейских времён до наших дней
4. How come? — Как вы пришли к такой теме статьи? Что было первично: идея, данные — или некий микс? См. блок «Идея + Данные»
5. Цель статьи и главная гипотеза/ исследовательский вопрос:
- Почему такую статью стоит написать?
- Кому она нужна?
- Каких результатов вы ожидаете достичь? Что вы хотите узнать в итоге?
6. Найдите 5 разных источников данных и датасетов, которые относятся к теме вашего исследования. Если хотите попрактиковаться, попробуйте найти данные в разных форматах, но это необязательно. Используйте только те форматы данных, которые мы обсуждали на занятии и которые есть в туториалах.
- Ссылка на источник данных — общий домен, где найдены данные.
- Пример: https://data.mos.ru/
- Ссылка на датасет — ссылка на конкретный файл с данными. Может иметь разрешение .csv, .xlsx, .pdf или что-то подобное в конце URL. Если это не файл, а веб-таблица, ссылка должна вести прямиком к таблице.
- Пример: https://data.mos.ru/opendata/62321?isDynamic=false
7. Объясните, почему вы выбрали конкретно эти датасеты и какие выводы вы хотите получить из их анализа, то есть что именно вы хотите узнать из этих конкретных датасетов.
🌻 Инфографика (готовая картинка) — не данные! Ищите первоисточники, ищите систематизированные пообъектные значения.
🌻 Синтетические данные (synthetic data) брать нельзя! Ищите данные с понятной, чёткой методологией и/или из источника, заслуживающего доверие.