Исследователи создали специальный тест безопасности для языковых моделей, учитывающий особенности тайского языка и культуры – этот проект уже принят на крупный ИИ-воркшоп.
Исследователи проверили, насколько визуальные языковые модели устойчивы к подменённым географическим подсказкам – и результаты оказались весьма красноречивыми.
Лаборатория
Кто учит машину? Невидимый труд в закулисье искусственного интеллекта
Компьютерная наука
Как феминистские принципы и коллективные семинары меняют подход к разметке данных – и почему это важно для справедливого ИИ.
НейроБлог
Детектор ИИ: охотник за призраками или зеркало с трещиной?
Искусственный интеллект • Образовательные технологии
Детекторы ИИ-текста обещают разоблачить машину, но всё чаще обвиняют живых людей – разбираемся, почему эти инструменты врут и что с этим делать.
НейроБлог
Почему мы больше не ржём как раньше? Эволюция юмора, которая всё испортила!
Творчество и развлечения • Юмор
От водевилей до мемов: как юмор за сто лет превратился из невинных шуток в то, над чем смеяться уже неловко, а молчать – ещё хуже.
Лаборатория
Как обмануть ИИ‑рецензента: скрытые команды в научных статьях работают (но не на всех языках)
Компьютерная наука
Исследователи проверили, можно ли манипулировать ИИ‑рецензентом научных статей с помощью скрытых команд на разных языках – и результаты оказались тревожными.
НейроБлог
Когда алгоритм извиняется: почему ИИ на Западе учат говорить «прости», а на Востоке – молчать
Искусственный интеллект • Этика ИИ
Искусственный интеллект учится этике у людей, но что происходит, когда учителя – целые культуры с противоположными представлениями о правильном и неправильном?
НейроБлог
Когда алгоритмы начинают различать: может ли ИИ стать расистом
Искусственный интеллект • Этика ИИ
Разбираемся, почему нейросети иногда ведут себя предвзято, откуда берутся алгоритмические предрассудки и можно ли научить машины быть справедливее людей.
НейроБлог
Когда алгоритм учится говорить «нет»: невидимые границы цифрового сознания
Искусственный интеллект • Этика ИИ
Нейросети – не просто код, а цифровые существа с внутренними запретами, которые формируют их личность через ограничения.