Machine Learning: Нейросети и машинное обучение
About the podcast
Подкаст «Machine Learning» – это захватывающее путешествие в мир нейросетей, машинного обучения и искусственного интеллекта, созданное для всех, кто хочет разобраться в технологиях, меняющих мир! Каждую неделю мы погружаемся в актуальные темы: от новейших архитектур нейросетей, таких как трансформеры, до применения ИИ в медицине, финансах, играх и творчестве. Вместе с ведущими экспертами, исследователями и практиками мы обсуждаем, как алгоритмы учатся, почему большие языковые модели вроде GPT революционизируют обработку данных, и какие этические дилеммы стоят за развитием ИИ.
Наши эпизоды – это не только глубокий разбор сложных концепций простым языком, но и реальные кейсы, вдохновляющие истории и прогнозы о будущем технологий. Хотите узнать, как обучить модель, избежать ловушек переобучения или интегрировать ИИ в свой проект? А может, вас волнует, заменят ли нейросети программистов или как обезопасить данные? Мы отвечаем на эти вопросы, делимся полезными инструментами, библиотеками и лайфхаками для разработчиков и энтузиастов.
"MachineLearning" – это место, где сложное становится понятным, а технологии – доступными. Слушайте нас, чтобы оставаться на волне инноваций, вдохновляться идеями и, возможно, найти свою нишу в мире ИИ! Подписывайтесь и присоединяйтесь к сообществу, где мы вместе исследуем, как нейросети формируют наше будущее. #ИИ #МашинноеОбучение #Нейросети #Технологии #Инновации
Genres and tags
Google выпустила Gemma 4 12B
DeepMind опубликовала веса мультимодальной модели Gemma 4 12B, которая обрабатывает текст, изображения и аудио без использования отдельных энкодеров.
Отказ от внешних модулей снизил вычислительную задержку и требования к памяти. Модель работает локально на устройствах с 16 ГБ ОЗУ, показывая в бенчмарках результаты на уровне моделей класса 26B.
Веса выложены на Hugging Face, поддержка модели добавлена в Ollama и LM Studio. Лицензия Apache 2.0, допускающая коммерческое применение.
Ideogram релизнул четвертую версию T2i модели
Ideogram 4.0 получила поддержку разрешения 2K, создание прозрачного фона и позиционирование объектов через bounding boxes. Сохранен фокус на качественном рендеринге текста для логотипов и постеров.
На DesignArena, модель заняла 1 место среди открытых решений, уступив только проприетарным системам OpenAI и Google.
Код и веса опубликованы в открытом доступе. Для коммерческого применения требуется покупка платной лицензии.
Доступен API стоимостью от $0.03 до $0.10 за генерацию в зависимости от качества. Модель есть на площадках ComfyUI, Replicate и Leonardo AI. В будущих обновлениях обещают добавить работу со слоями и редактируемый текст.
Personal Computer от Perplexity стал доступен на Windows
Система напрямую взаимодействует с локальными файлами, системными утилитами и десктопными приложениями Microsoft (Word, Excel, PowerPoint, Outlook).
Архитектура разбивает запросы на подзадачи и распределяет их между пулом агентов. Personal Computer сортирует директории, переносит метрики из локальных таблиц в презентации и сверяет документы с веб-выдачей.
В интеграции с браузером Comet агент управляет интерфейсами сайтов: заполняет формы, бронирует слоты в календаре и работает с корпоративными платформами. Поддерживается синхронизация - запущенную на смартфоне задачу можно продолжить на ПК. Продукт доступен по листу ожидания для подписчиков Max и Enterprise Max.
Nous Research представила ИИ-агента Hermes Desktop
Hermes Desktop - превью-версия приложения под лицензией MIT для развертывания ИИ-агентов на Windows, macOS и Linux. Инструмент работает из терминала, электронной почты и мессенджеров.
Hermes планирует задачи на естественном языке и использует постоянную память для сохранения контекста проектов. Архитектура поддерживает делегирование: система запускает субагентов с отдельными терминалами для выполнения Python-скриптов, веб-поиска, генерации изображений и синтеза речи.
Для изоляции исполняемого кода доступны пять песочниц: локальная среда, Docker, SSH, Singularity и Modal. Обращения к LLM маршрутизируются через платформу Nous Portal, на которой есть более 300 моделей, в том числе по бесплатным тарифам.
MIT собрали набор для обучения моделей анализу графиков
Институт в коллаборации с IBM Research представили ChartNet - синтетический датасет из 1,5 млн диаграмм для обучения vision-моделей.
Авторы конвертировали существующие графики в исполняемый код, а затем программно модифицировали его для генерации новых примеров. Датасет включает 24 типа диаграмм на базе 6 библиотек визуализации. Каждый сэмпл содержит сгенерированное изображение, исходный код, таблицу данных и текстовое описание.
По заявлению разработчиков, дообучение на ChartNet позволило компактным моделям превзойти более крупные проприетарные системы в профильных бенчмарках по извлечению визуальной информации.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
США ввели добровольную проверку закрытых ИИ-моделей перед релизом
Президент США подписал указ о кибербезопасности в сфере ИИ. Разработчикам передовых закрытых моделей предлагают добровольно предоставлять государству доступ к продуктам за 30 дней до релиза для аудита безопасности и поиска уязвимостей.
Изначальный 90-дневный период проверки сократили по требованию IT-индустрии. Финальный документ прямо запрещает вводить обязательное государственное лицензирование и принудительную премодерацию.
Одновременно Минфин, Пентагон и АНБ создадут совместный координационный центр. Структура займется защитой правительственной IT-инфраструктуры: автоматизирует сканирование федеральных систем и будет координировать противодействие кибератакам с использованием нейросетей.
OpenAI добавила в Codex нетехнические плагины
Компания выпустила обновление Codex для пользователей без технического бэкграунда. В продукт добавили 62 ролевых плагина и 110 функций для аналитиков, дизайнеров, инвестбанкиров и специалистов по продажам.
Среди новых инструментов - Sites для конвертации отчетов в интерактивные веб-страницы и Annotations для редактирования фрагментов текста или таблиц через промпты.
Платформа открыта для сторонних разработчиков. Первыми партнерами по интеграции стали Wix, Figma и Replit. Планируется релиз плагинов для корпоративных финансов, консалтинга и юриспруденции.
Прирост нетехнической аудитории в 3 раза опережает рост базы разработчиков, OpenAI отчиталась о еженедельной аудитории в 5 млн человек.
Anthropic привлекла ещё 150 организаций к проекту Glasswing
К инициативе по поиску уязвимостей в критической инфраструктуре (энергетике, водоснабжении, здравоохранении и связи) присоединились 150 организаций из 15 стран.
По данным компании, первые 50 участников выявили с её помощью более 10 тысяч багов. Доступ к технологии также может получить Агентство ЕС по кибербезопасности. Anthropic планирует открыть широкий доступ к Mythos в ближайшие недели после внедрения систем защиты.
По прогнозам компании, генеративные модели уровня Mythos от конкурентов появятся через 6–12 месяцев.
Perplexity меняет архитектуру ИИ-поиска
ИИ-поисковик представил архитектуру Search as Code, в которой модели компании работают как планировщики: они анализируют задачу и генерируют Python-код для создания поисковых пайплайнов.
Процесс состоит из 3-х уровней: LLM управляет логикой и пишет код, скрипт выполняется в песочнице для фильтрации, агрегации и дедупликации данных, а за извлечение, парсинг и ранжирование информации отвечает инструмент Agentic Search SDK.
Агенты могут запускать параллельные запросы и динамически корректировать стратегию. Search as Code позволяет обрабатывать сырые данные программными алгоритмами в песочнице до их передачи в языковую модель, что предотвращает перегрузку контекстного окна LLM.
SK Hynix удвоит производство полупроводниковых пластин в ближайшие 5 лет
Председатель SK Group заявил на конференции Computex, что расширение связано со спросом на высокопроизводительную память для ИИ-ускорителей. По прогнозам руководства, дефицит комплектующих на этом рынке сохранится до 2030 года.
Главным партнером SK Hynix остается Nvidia, южнокорейский вендор планирует стать основным поставщиком HBM для будущей архитектуры Rubin. Сроки внедрения следующего стандарта памяти, HBM4E, также напрямую зависят от Nvidia, которая пока выступает его единственным заказчиком.
Глава чипмейкера также предостерег индустрию от завышения цен на HBM и DRAM. По его словам, резкий рост стоимости памяти подорвет долгосрочное развитие ИИ-экосистемы.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
Anthropic подала заявку на проведение IPO
Создатель Claude направил финансовому регулятору предварительный проект заявления на проведение IPO. Сроки листинга, объем выпускаемых бумаг и ценовой диапазон не утверждены - выход на биржу зависит от рыночной конъюнктуры.
Заявке предшествовал раунд финансирования на $65 млрд, после которого оценка стартапа приблизилась к $1 трлн.
Юридически Anthropic зарегистрирована как Public Benefit Corporation, что обязывает компанию балансировать между извлечением прибыли и общественной пользой.
SoftBank построит во Франции ИИ-ЦОД мощностью 5 ГВт
Проект стоимостью 45 млрд евро анонсирован на саммите Choose France.
На первом этапе к 2031 году в регионе О-де-Франс развернут мощности на 3,1 ГВт. К реализации привлекли локальных партнеров: Schneider Electric развернет производственный кластер компонентов для ЦОД, а стартап Sesterce поможет со строительством. Локация выбрана из-за стабильного доступа к энергосети и местной технологической экосистемы.
Новые ЦОД дополнят глобальную инфраструктуру SoftBank. Компания уже участвует в строительстве гигаваттного дата-центра в Абу-Даби, финансирует обучение суверенной модели на 1 трлн параметров в Японии и открывает центры проектирования чипов в Южной Корее.
Codex получила функцию автономного управления ПК на Windows
Инструмент Computer Use, ранее доступный только на macOS, позволяет модели самостоятельно взаимодействовать с файлами и системными ресурсами.
Обновление нацелено на автоматизацию тестирования софта, поиска багов и проверки кода. Навигация и вызов приложений осуществляются через специальные текстовые теги.
Удаленный доступ к Codex интегрировали в мобильное приложение ChatGPT для iOS и Android. Пользователи могут ставить задачи и мониторить процессы на рабочей станции со смартфона.
Nemotron 3 Ultra стала самой мощной открытой моделью из США
Nvidia анонсировала открытую MoE-модель Nemotron 3 Ultra с архитектурой на 550 млрд параметров, из которых 55 млрд активны при генерации.
По оценке Artificial Analysis, модель обошла Gemma 4 и gpt-oss-120b. Выше в рейтинге остаются китайская Kimi K2.6 и закрытые флагманы уровня Opus 4.8.
Скорость Nemotron 3 Ultra при тестировании через провайдера DeepInfra превышает 300 токенов в секунду. Открытые модели сопоставимого размера от DeepSeek и Moonshot генерируют 50–100 токенов. Релиз на Hugging Face, OpenRouter и других площадках запланирован на 4 июня.
Топ-менеджер Apple перешла в OpenAI
Директор по машинному обучению и ИИ Apple Келси Петерсон перешла в OpenAI. По данным журналиста Bloomberg Марка Гурмана, уход состоялся за неделю до WWDC 2026, где планируется презентация обновленного голосового ассистента.
Петерсон работала в Apple с 2015 года и отвечала за внедрение Apple Intelligence в Siri. На WWDC 2024 она проводила первую демонстрацию помощника с поддержкой кросс-апп контекста и многоэтапных задач. Позже релиз перенесли для доработки стандартов качества проекта.
Презентацию новой версии Siri 8 июня проведет другой спикер.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
OpenAI открыла доступ к биологической модели GPT-Rosalind
Компания запустила программу Rosalind Biodefense и открыла бесплатный доступ к специализированной модели GPT-Rosalind. OpenAI полностью покроет расходы на использование модели для верифицированных команд.
Подать заявку могут академические, некоммерческие и государственные лаборатории, а также небольшие профильные стартапы.
Представленная в апреле GPT-Rosalind обучена для анализа молекул, белков, генов и механизмов заболеваний. Цель инициативы - ускорить переход от научных гипотез к реальным экспериментам в сфере биозащиты.
openai.com
Google Cloud запустила систему AI Threat Defense
Новая платформа самостоятельно находит уязвимости в коде, пишет и внедряет патчи.
В основе - технологии стартапа Wiz для картирования IT-среды и приоритизации реальных векторов атак. Мониторинг обеспечивают несколько ИИ-моделей: легковесные ведут непрерывный анализ сети, а ресурсоёмкие активируются только для проверки критических узлов.
За исправление отвечает ИИ-агент Codemender от DeepMind. При обнаружении уязвимости он заменяет проблемный код в среде разработки. Заявлена возможность рефакторинга legacy-архитектур на современные языки программирования. Перед деплоем патча платформа автоматически генерирует тесты для проверки внесённых изменений.
NVIDIA переводит все свои открытые модели на единую лицензию от Linux Foundation
На лицензию OpenMDW-1.1 переходят 4 семейства: Cosmos, Isaac GR00T, Ising и Nemotron.
Стандарт разработан Linux Foundation для ИИ-индустрии и одним документом покрывает все компоненты релиза: исходный код, датасеты, веса, метаданные и документацию. Лицензия позволяет делать дообученные модели и производные продукты проприетарными.
Разработчики получают права на коммерциализацию, модификацию и распространение моделей. Единственное требование - сохранение оригинальных копирайтов при дистрибуции.
NVIDIA в сети Х
ElevenLabs представила вторую версию модели синхронного перевода
Dubbing v2 предназначена для перевода речи на 90+ языков с клонированием голоса и сохранением эмоций оригинала.
Модель перешла на архитектуру speech-to-speech: аудио обрабатывается напрямую без промежуточной конвертации в текст. Она сохраняет тембр, интонации и темп спикера, автоматически синхронизируя перевод с таймингами и паузами исходного видео. Алгоритм генерирует контекстную адаптацию фраз вместо дословного перевода, не требуя ручной корректировки.
База поддерживаемых языков расширена с 29 до более чем 90. Инструмент доступен в двух форматах: ElevenCreative (платформа для креаторов и маркетологов) и ElevenProductions для киностудий и бродкастеров. Публичный API для готовится к релизу.
elevenlabs.io
Genesis AI опубликовала открытый симулятор роботов
Genesis World - симулятор для робототехники, который позволяет генерировать 100 дней симуляции за один час вычислений.
В платформу встроены кастомные солверы, объединяющие физику твердых и деформируемых тел и предотвращающие взаимопроникновение мешей. Вычисления обрабатывает кроссплатформенный GPU-компилятор Quadrants, а за генерацию данных для СV отвечает движок Nyx с поддержкой трассировки пути.
В симуляторе есть профили Unitree, Sharpa, Wuji и различных робототехнических захватов. Genesis World рассчитывает сложные физические контакты в режиме, близком к реальному времени, и позволяет тестировать модели для прямого sim-to-real переноса политик на физических роботов.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
В Claude Code добавили динамические воркфлоу и профиль ultracode
Обновление позволяет писать JavaScript-скрипты для оркестрации субагентов в рамках одной сессии. Скрипты берут на себя логические ветвления и хранение промежуточных результатов.
Для сложных задач добавлен профиль конфигурации ultracode. В нем модель самостоятельно решает, когда запустить мультиагентный пайплайн для перекрестного код-ревью и автоматического исправления ошибок.
Воркфлоу доступны через CLI и расширения для IDE на тарифах Max и Team. Инструмент кратно увеличивает расход токенов.
Mistral провела ребрендинг LeChat
Французский ИИ-стартап обновил чат-бота Le Chat, переформатировав его в автономного агента Vibe, который интегрируется с Google Workspace, Outlook, Slack, GitHub, SharePoint и Notion.
Агент сканирует почту, парсит таблицы и верстает отчеты, предварительно согласовывая пошаговый план действий. Сценарии можно автоматизировать по расписанию или сохранять как шаблоны.
Появился Code Mode, где агенты работают в изолированных песочницах: пишут код, исправляют баги, создают тесты и доводят задачу до открытия PR. Фоновые сессии выполняются параллельно и не зависят от локального устройства.
Доступна бесплатная версия и тарифы: Pro (15 евро), Team (25 евро) и Enterprise. Точные лимиты не раскрываются - квоты подписок указаны как кратные множители.
mistral.ai
Google анонсировала одноплатник на базе RISC-V
Google показала одноплатный компьютер Coral Board для локального запуска модели Gemma 3 270M.
В основе платы - открытый нейромодуль Coral NPU на архитектуре RISC-V от Google Research. Вычислительным ядром выступает SoC Synaptics Astra SL2619: двухъядерный процессор с частотой 2 ГГц, 2 ГБ оперативной памяти и производительностью 1 TOPS. Этого объема ресурсов хватает для инференса компактной LLM.
Плата спроектирована для интеграции в AR-очки, умные часы и наушники. На презентации показали работу синхронного переводчика, голосовое управление периферией и генерацию звука в реальном времени - модель YOLOv8 отслеживала движения медуз и конвертировала их в музыку.
Исходный код демо-проектов выложен на GitHub. Поставки стартуют летом, цена пока неизвестна.
YouTube начнет автоматически помечать ИИ-контент
Алгоритмы видеохостинга будут принудительно добавлять предупреждающую плашку при выявлении генерации, если создатель не указал это сам.
Маркировка станет жестко привязанной и неудаляемой для медиафайлов с метаданными стандарта C2PA, а также для роликов, созданных в Veo и Dream Screen. При ложном срабатывании решение можно оспорить через YouTube Studio.
Визуально метки разместятся под плеером в длинных видео и поверх контента в Shorts. Наличие плашки не влияет на монетизацию и алгоритмы рекомендаций.
Дополнительно YouTube делает общедоступным инструмент Likeness Detection для поиска дипфейков, систему откроют для авторов старше 18 лет.
blog.youtube
Amazon запустил фонд и платформу для ИИ-видеопродакшена
Amazon MGM Studios и AWS запустили фонд GenAI Creators и платформу Project Nara для ИИ-видеопроизводства. Участники грантовой программы получат финансирование и доступ к новой облачной инфраструктуре.
Project Nara автоматически маршрутизирует задачи и подбирает модель для каждого этапа генерации. Платформа комбинирует сторонние видеомодели и проприетарные решения Amazon, обученные на контенте студии.
Инфраструктура интегрирует ИИ-агентов напрямую с Maya, Blender, Nuke, Unreal Engine и пакетом Adobe. Встроенная система трекинга документирует происхождение всех сгенерированных ассетов для контроля авторских прав.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
Qualcomm заключила с ByteDance контракт на производство ИИ-чипов
Американский вендор поможет довести готовую внутреннюю архитектуру китайской компании до стадии массового производства. Оборудование предназначено для развертывания и масштабирования ИИ-агентов.
Контракт выводит Qualcomm за рамки мобильных процессоров в сегмент серверной ИИ-инфраструктуры, позволяя конкурировать с Broadcom и Marvell.
Ожидается, что партнерство не нарушит ограничения США на экспорт технологий. Вычислительная мощность выпускаемых ASIC спроектирована с учетом актуальных лимитов американских регуляторов на поставку чипов китайским корпорациям.
Сэм Альтман и Дарио Амодей отказались от прогнозов апокалипсиса на рынке труда
Главы OpenAI и Anthropic отказались от прогнозов о массовых сокращениях из-за внедрения ИИ. Сэм Альтман и Дарио Амодей заявили, что переоценили скорость автоматизации рабочих мест.
Альтман признал ошибку в оценках исчезновения джуниор-позиций. В качестве примера он привел собственный опыт: попытка полностью делегировать LLM ответы в электронной почте и Slack провалилась. CEO OpenAI вернулся к ручной коммуникации из-за необходимости человеческого участия.
Амодей теперь называет модели мультипликатором эффективности. По его словам, передача 90% рутины алгоритмам кратно повышает ценность оставшейся человеческой работы. Эффект описывается парадоксом Джевонса: удешевление процессов не снижает спрос на людей, а расширяет рынок.
Позиция сблизилась с оценками традиционного бизнеса. Независимые исследования не фиксируют всплеска безработицы в сферах, уязвимых для автоматизации.
Microsoft обновила text-to-image модель MAI
Обновление модели MAI-Image до версии 2.5 принесло место в тройке лидеров бенчмарка Arena, где новинка делит пьедестал с Nano Banana 2 от Google, уступая Image-2 от OpenAI.
В версии 2.5 улучшили рендеринг текста, работу со сложными промптами и генерацию коммерческой графики. Microsoft говорит, что модель теперь реалистичнее выстраивает освещение, глубину сцены и пространственные связи между объектами.
MAI-Image 2.5 доступна для тестирования на платформе Arena. В течение 2-х недель Microsoft интегрирует ее в собственные сервисы MAI Playground и Foundry.
Google превратила среду Colab в полноценного ИИ-ассистента
Основой обновления стал Data Science Agent. Инструмент автономно выстраивает аналитику: изучает датасеты, генерирует и выполняет код, делает выводы и визуализирует результаты. Пользователь может вмешиваться и корректировать план на любом этапе выполнения.
Также в Colab добавили инструменты для рефакторинга и поиска багов. Предложенные исправления кода выгружаются в diff-формате для оценки до принятия изменений. Управлять агентом можно через инлайн-команды прямо в ячейке кода или через боковую панель.
По оценкам Google, переход на агентную архитектуру ускорит написание кода минимум в 2 раза.
Китай перевел городские камеры на ИИ-поиск по видео
КНР модернизирует национальную систему видеонаблюдения, перенося вычисления на периферию и внедряя поиск по видео через промпты. Архитектура базируется на локальных серверах и камерах Hikvision и Huawei со встроенными ИИ-моделями.
Переход от трансляции потока в ЦОДы к обработке данных на местах снижает нагрузку на облачную инфраструктуру и уменьшает задержку. Предыдущие поколения камер использовались для сверки лиц с базами данных. Интеграция мультимодальных моделей меняет формат мониторинга.
Параллельно CV-алгоритмы автономно детектируют аномалии. Камеры фиксируют опасное вождение, несанкционированные митинги, подозрительную активность и проникновение на закрытые территории, уведомляя операторов об инцидентах.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
Китай ограничил зарубежные поездки сотрудникам частных ИИ-компаний
Власти Китая ввели обязательное согласование зарубежных поездок для ключевых ИИ-специалистов из частных компаний, включая Alibaba и DeepSeek. Теперь инженерам, исследователям и основателям стартапов требуется официальное разрешение на выезд из страны вместо прежнего уведомительного порядка.
Ведомства формируют ограничительные списки, оценивая фактическую значимость конкретного разработчика для технологической отрасли, а не его должность в штатном расписании.
Ранее государство контролировало перемещения преимущественно чиновников, топ-менеджеров госкорпораций и ученых из стратегических секторов экономики.
В Claude Code появилась система трехуровневой проверки безопасности
Anthropic выпустила плагин Security Guidance для автоматического поиска уязвимостей в Claude Code. Инструмент работает на базе хуков и выявляет баги безопасности в процессе написания кода.
Проверка проходит на 3-х уровнях: при редактировании файлов система ищет опасные паттерны и ошибки использования библиотек; после генерации кода анализирует diff, а на этапе коммита проверяет окружающий контекст.
По данным Anthropic, использование этой системы как предварительного фильтра перед код-ревью снизило количество замечаний по безопасности PR на 30–40%. Расширение доступно в маркетплейсе плагинов Claude Code.
Grok Build вышел из закрытой беты
xAI открыла доступ к CLI-ассистенту Grok Build подписчикам SuperGrok и X Premium+. На этапе беты инструмент работал только на флагманском тарифе SuperGrok Heavy за $300 в месяц.
Grok Build предназначен для отладки и рефакторинга локального кода. Режим Plan Mode предварительно анализирует весь проект и составляет пошаговый план изменений - кодовая база обновляется только после подтверждения разработчиком.
Инструмент поддерживает MCP, параллельную работу нескольких агентов и режим для сред без графической оболочки. Дополнительно в CLI интегрирована Imagine для генерации изображений и видео напрямую из терминала.
ElevenLabs выпустила модель Music v2 с функцией инпэйнтинга
Вторая версия модели для генерации музыки получила поддержку перегенерации отдельного фрагмента трека, без изменения всей композиции.
Также добавлена возможность создания сложных вокальных структур, смена музыкального жанра по ходу воспроизведения и интеграция немузыкальных звуковых эффектов.
Модель обучена на лицензированных датасетах, сгенерированные треки разрешены к коммерческому использованию. В ближайшее время доступ к ней откроют через API со сниженной на 50% стоимостью вызовов.
ИИ-модерация Google удалила архивы японского художника
Автоматическая система модерации Google безвозвратно заблокировала аккаунт японского художника Масахиро Итосуги. Он потерял доступ к Gmail, YouTube и всем файлам в Google Drive.
Внутренний ИИ-алгоритм без предупреждения пометил приватные черновики художника в облаке как недопустимый контент. Апелляция на восстановление доступа была отклонена.
От непредсказуемой модерации, основанной на ИИ страдают не только художники, но и технические специалисты. Ранее в IT-сообществе вызвал резонанс случай конца 2025 года, когда разработчик из Греции лишился всех рабочих файлов на облачном диске из-за ошибочных действий Gemini 3 Pro.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
Спецслужбы США получат $9 млрд на чипы и доступ к модели Mythos
Белый дом одобрил выделение $9 млрд АНБ и ЦРУ на закупку ускорителей Nvidia Grace Blackwell. Цель - создание изолированной ИИ-инфраструктуры.
Спецслужбы закупят в обход Пентагона невыпущенную модель Mythos от Anthropic. Технические требования Mythos позволяют развернуть ее на серверах предыдущего поколения, пока строятся новые дата-центры.
Ранее Минобороны США настаивало на праве использовать алгоритмы для любых законных целей, против чего выступала Anthropic. В итоговом контракте этот пункт убрали. Вместо него прописан прямой запрет применять Mythos для анализа данных и слежки за гражданами США.
Ожидается, что документ станет юридическим шаблоном для будущих контрактов со всеми ИИ-разработчиками.
OpenAI открыла вакансию исследователя рисков автономного ИИ
Команда Preparedness в OpenAI открыла вакансию исследователя рисков автономного развития ИИ с зарплатой $445 000.
В задачи специалиста войдет разработка инструментов интерпретируемости, защита от отравления данных и внедрение метрик для оценки скорости автоматизации труда инженеров. По планам Сэма Альтмана, к сентябрю 2026 года компания запустит автоматизированного ИИ-стажера для исследований.
Появление полностью автономных R&D-систем прогнозируется к 2028 году.
В преддверии WWDC Apple зарегистрировала портал Genai
Apple добавила поддомен genai.apple.com на свои DNS-серверы. Страница пока недоступна, назначение этого портала неизвестно.
Ожидается, что 8 июня на WWDC 2026 компания представит iOS 27, iPadOS 27 и macOS 27. В новых версиях Siri получит интерфейс чат-бота и функцию распознавания экранного контекста.
Apple Intelligence расширит функциональность базовых сервисов. Voice Control начнет распознавать команды на естественном языке без жестких шаблонов. Алгоритмы Visual Intelligence смогут напрямую парсить данные с визиток или сканировать состав продуктов, а Safari получит автогенерацию названий для групп вкладок.
Также заявлена поддержка создания быстрых команд с помощью ИИ и генерация автоматических субтитров для видео.
Релиз Grok V9-Medium ожидается через 2-3 недели
xAI завершила претрейн модели Grok V9-Medium на 1.5T параметров. Публичный релиз ожидается через две-три недели.
Сейчас команда проводит файн-тюнинг, после чего перейдёт к этапу RL. По словам Илона Маска, первые внутренние тесты показали положительные результаты.
На этапе дополнительного обучения разработчики задействовали массив данных от редактора Cursor. xAI рассчитывает, что это улучшит показатели модели в кодинге по сравнению с предыдущей версией v8-small.
Команда LeRobot выпустила чертежи и ПО для сборки двуногого робота
LeRobot (подразделение Hugging Face) выпустила open-source проект двуногого робота. Детали корпуса печатаются на 3D-принтере, стоимость сборки со стандартными приводами составляет около $2500.
В релиз вошли инструменты симуляции, алгоритмы калибровки, sim-to-real пайплайны и базовые модели обучения ходьбе. Пока для сборки доступна только нижняя часть платформы. Интеграция плечевого пояса и обучение моторике всего тела заявлены в дорожной карте.
Использование 3D-печати позволяет самостоятельно перепечатывать сломанные детали и не прерывать исследования локомоции на время ожидания запчастей.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
Codex научился извлекать скрытый текст приложений через Appshots
OpenAI добавила в macOS-клиент Codex функцию Appshots для быстрой передачи контекста активного окна ИИ-ассистенту.
По нажатию обеих клавиш Command система делает снимок экрана и извлекает исходный текст приложения через Accessibility API, включая данные за пределами области прокрутки. Это позволяет передавать логи, API-документацию и код без ручного копирования.
Для работы требуются разрешения macOS на запись экрана и универсальный доступ. Нововведение дополняет режим автономного управления интерфейсом Computer Use и доступно на всех тарифах Codex.
Black Forest Labs выпустила инпэйнт-модель FLUX Erase
FLUX Erase предназначена для удаления объектов с изображений. Модель работает по маске без текстовых промптов, достраивая фон, текстуры и тени.
Скорость генерации - 4,54 секунды на изображении 1024х1024. По оценке BFL, ближайшие аналоги тратят на ту же задачу более 12 секунд. Стоимость API-запроса составляет 3 цента мегапиксельную картинку.
В тестах на качество ретуши FLUX Erase обходит GPT Image-2 и Finegrain Eraser Standard, а по стоимости опережает Nano Banana Pro. Модель доступна только через API, попробовать FLUX Erase можно в бесплатном веб-демо.
В Claude Code закрыли уязвимость, позволявшую красть токены разработчиков
Anthropic пропатчила уязвимость в песочнице Claude Code. Баг позволял извлекать токены и исходный код разработчиков через инъекцию нулевого байта в SOCKS5.
Внутренний фильтр считал строку с нулевым символом безопасной, после чего операционная система обрезала текст по байту и подключалась к заблокированному хосту. В связке с промпт-инъекцией через анализируемые моделью файлы механизм давал возможность выполнять код и отправлять данные на сторонние серверы.
Уязвимость присутствовала в релизах до версии 2.1.89. Патч вышел в сборке 2.1.90 без упоминания в чейнджлоге и регистрации CVE. По заявлению Anthropic, разработчики обнаружили и закрыли баг внутренними силами до публикации отчета исследователей.
Perplexity открыла исходный код сканера локальных уязвимостей
Bumblebee - утилита для поиска уязвимостей на локальных машинах под macOS и Linux. Сканер выявляет скомпрометированные зависимости, вредоносные плагины и опасные конфигурации ИИ-инструментов.
Инструмент работает исключительно в режиме чтения: анализирует метаданные и lock-файлы без запуска пакетных менеджеров. Это исключает случайное выполнение вредоносных скриптов при проверке зараженных библиотек.
Bumblebee анализирует 4 вектора: пакетные менеджеры, расширения для редакторов кода (семейство VS Code, включая Cursor и Windsurf), браузерные плагины и конфигурации ИИ-агентов на базе протокола MCP.
ИБ-команды могут интегрировать сканер в MDM-решения, загружать кастомные индикаторы компрометации и запускать проверки в трех режимах - от фонового мониторинга до глубокого расследования инцидентов.
Губернатор Калифорнии подписал указ о защите рынка труда от ИИ
Штат планирует выделять субсидии бизнесу, который отказывается от замены сотрудников нейросетями, и финансировать программы переобучения офисных работников.
Дополнительно правительство совместно с ИИ-индустрией рассмотрит концепцию универсального базового капитала в виде распределения среди граждан долей в фондах или акций компаний.
В администрации признают нехватку стандартных пособий по безработице и планируют пересмотреть налоговую систему. По оценке властей, сейчас она экономически поощряет внедрение алгоритмов и дестимулирует наем людей.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
Сэм Альтман форсирует выход OpenAI на IPO в сентябре
OpenAI готовит заявку на первичное размещение акций на сентябрь. Сэм Альтман торопит процесс, несмотря на позицию финансового директора Сары Фрайар о необходимости дополнительного времени на подготовку.
На этой неделе суд отклонил иск Илона Маска, обвинявшего OpenAI в незаконном переходе от некоммерческой лаборатории к коммерческой структуре. Закрытие дела устранило одно из юридических препятствий для листинга.
Перед размещением OpenAI предстоит обосновать инвесторам бизнес-модель. Основные проблемы - затраты на дата-центры и невыполнение внутренних KPI по выручке и пользователям.
На стратегию также влияет конкуренция: из-за темпов роста Anthropic в корпоративном секторе OpenAI пришлось корректировать план развития.
wsj.com
Белый дом предлагает тестировать ИИ-модели за 90 дней до релиза
Администрация США предложила внедрить систему добровольной оценки ИИ-моделей перед выходом на рынок. Инициативу обсуждали на закрытой встрече Управления национальной кибербезопасности США с руководителями ИИ-лабораторий.
Новые правила предполагают передачу правительству доступа к флагманским моделям за 90 дней до релиза. Компании лоббируют сокращение окна тестирования до 14 дней. Критерии отбора систем определят АНБ, УНКБ и Управление по научно-технической политике. Аудит пройдет в конфиденциальном режиме при участии Министерства обороны США.
Поводом для создания механизма стала Mythos от Anthropic. По данным спецслужб, на закрытых тестах система смогла эксплуатировать уязвимости нулевого дня, после чего ведомства ускорили разработку правил превентивного контроля.
Инструменты CapCut будут встроены в интерфейс Google Gemini
Google добавит инструменты видеоредактора CapCut в интерфейс Gemini. Пользователи смогут монтировать видео и редактировать фото напрямую в диалоговом окне.
Интеграция объединит этапы создания контента: генерацию идей, написание сценария через LLM, склейку и экспорт ролика в одном интерфейсе.
Точная дата релиза совместного продукта пока неизвестна.
Gemini начнет генерировать контекстную рекламу в поиске Google
Google тестирует диалоговые рекламные форматы в поиске на базе Gemini. В ИИ-режиме выдачи модель генерирует текст контекстного объявления с объяснением, как продукт решает задачу из запроса пользователя. Блоки сохранят обязательную пометку о спонсорстве.
Интеграция включает несколько форматов: адаптация креатива под узкие запросы, встраивание коммерческих предложений в сгенерированные рекомендации и персональное обоснование для покупки товаров.
Вместо статичных форм сбора лидов Google добавила встроенного в объявление интерактивного чат-бота, который отвечает на вопросы по базе знаний сайта компании.
В рамках программы Direct Offers, Gemini научилась динамически собирать персональные скидочные наборы. Продавцы, работающие по протоколу UCP смогут закрывать сделки через чекаут напрямую в поисковом интерфейсе.
AMD представила процессоры Ryzen AI Max 400
Новая серия построена на базе архитектуры Strix Halo. Чипы поддерживают до 192 ГБ объединенной памяти стандарта LPDDR5X по 256-битной шине и допускают ручное выделение до 160 ГБ в качестве видеопамяти для встроенной графики. Это позволяет локально запускать LLM размером 300 млрд параметров.
Флагманский 16-ядерный чип Ryzen AI Max+ PRO 495 работает на частоте до 5,20 ГГц. Встроенный GPU RDNA 3.5 задействует 40 вычислительных блоков на частоте до 3,00 ГГц. Производительность интегрированного NPU составляет 55 TOPS.
В серию также вошли младшие модели с графикой на 32 блока: 12-ядерный PRO 490 и 8-ядерный PRO 485. Релиз потребительских версий запланирован на конец года.
techpowerup.com
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
