«Проект етикетки з набором даних» займається питаннями охорони здоров’я та стандартів даних Центру Беркмана Кляйна

Ми використовуємо алгоритми для щоденного прийняття рішень, починаючи від пошуку маршруту з найменшою торгівлею, до перегляду новин та прийняття рішень про найм на роботі. Оскільки прийняття алгоритмічних рішень стає все більш поширеним, потрібно зробити багато важливої ​​роботи, щоб забезпечити розробку алгоритмів з урахуванням точності, упередженості та справедливості. Все частіше журналісти та науковці досліджують та викривають упередженість в алгоритмічних результатах, але менше уваги приділяється упередженості в даних, що використовуються для підготовки цих алгоритмів.

етикетки

Проект Databel Nutrition Label Project (DNLP), який був створений під час програми асамблеї 2018 року, організованої Центром Беркмана Клейна та Медіалабораторією MIT, прагне вирішити цю проблему в нашому розумінні стану здоров'я та якості даних.

Передумова проекту проста. Цілісність моделі машинного навчання принципово базується на даних, що використовуються для її навчання - як говориться, "сміття всередині, сміття винесене". Замість того, щоб чекати оцінки моделей після їх створення, DNLP прагне полегшити швидку оцінку життєздатності та придатності набору даних перед тим, як його використовувати для підготовки моделі, надаючи їй позначку «поживність».

У 2018 році команда DNLP розробила кількісні та якісні заходи щодо охорони здоров'я набору даних. Зараз команда працює над тим, щоб упакувати ці заходи у просту у використанні “етикетку поживності даних”. Ознайомтеся з їх першим прототипом тут, побудованим на наборі даних Dollar for Docs ProPublica. Команда також написала довідковий документ, що пояснює їх структуру та концепцію маркування поживних даних.

Починаючи з минулорічної програми Асамблеї, проект зростав і розвивався. Ми поговорили з чотирма членами нинішньої команди проекту - Касею Хмелінський, керівник проекту; Сара Ньюман, дослідник і стратег; Джош Джозеф, Дослідник ШІ; та Метт Тейлор, дослідник даних та керівник семінару - щоб дізнатися більше про те, як Асамблея об’єднала їх разом і над чим вони працюють зараз. Інтерв’ю відредаговано для ясності.

Асамблея збирає невелику когорту технологів, менеджерів, політиків та інших професіоналів для вирішення нових проблем, пов'язаних з етикою та управлінням штучним інтелектом. Чотиримісячна програма розпочинається двотижневим інтенсивним процесом роздумів та коротким курсом, під час якого учасники починають формувати команди проектів. Далі слідує дванадцятитижневий період спільного розвитку, коли команда будує свої проекти.

Минулий рік був другою ітерацією Асамблеї з когортою з дев’ятнадцяти осіб. До кінця програми група створила шість проектів, включаючи DNLP.

Під час нашого інтерв'ю команда DNLP розповіла про те, як програма Асамблеї об'єднала їх та заохотила міждисциплінарну співпрацю.

Джош Джозеф: Як інженер ШІ, я дуже люблю будівельні речі. Чесно кажучи, до програми я не замислювався над великою частиною етики, політики, управління та законодавства, пов’язаних із ШІ. Асамблея була способом глибшого роздуму над важливими питаннями, наприклад, „що ми маємо на увазі під упередженням?”, І в той же час, насправді працювати над проектом і будувати щось із людьми, які не всі є інженерами. Як інженер, я багато чого отримав від того, що мене кидали виклики таким чином.

КАСІЯ ЧМІЄЛІНСЬКИЙ: Домовились. Під час бесіди про етичні технології часто може здатися, що є люди, які будують технології, а потім є люди, які пишуть статті про наслідки цієї технології. Рідко їм вдається зібратися для співпраці. Асамблея мала можливість подумати про етику та реалізувати ідеї з цих дисциплін. Наша група дійсно різноманітна. Ми думаємо про мистецтво та медіа, навчання, управління продуктами та інженерію. І це відображено в результатах нашого проекту: прототип, але також і документ, і зараз ми також регулярно говоримо між доменами. Я дуже радий за можливість провести ці бесіди по всій галузі.

Сара Ньюман: Асамблея об'єднує людей з різним корінням, а програма заохочує та сприяє співпраці, що дає дійсно унікальні результати. Ми придумали спільну мову, були щедрими один з одним і розробляли проекти, які були сильнішими, ніж вони були б в іншому випадку, через наші різноманітні перспективи та підходи до вирішення проблем.

Одна справа - поїхати на захід чи конференцію, де є люди, які приїжджають з різних сфер чи різних секторів. Ви зустрічаєтесь, розмовляєте, розмовляєте про ідеї. Це чудово. Але є щось зовсім інше у фактичній роботі з людьми в команді; переживаючи злети і падіння, напруженість, успіхи, справді перебуваючи в процесі спільної роботи. Зв’язок стає набагато глибшим. Отже, однією з найбільших переваг Асамблеї для нашого проекту було співробітництво між секторами.