mas.to is one of the many independent Mastodon servers you can use to participate in the fediverse.
Hello! mas.to is a fast, up-to-date and fun Mastodon server.

Administered by:

Server stats:

12K
active users

#gpt

20 posts17 participants1 post today

Why is #BERT powerful? Bert is not a super big #LLM language model like #GPT. However, it provides a very flexible way for training a language #AI different tasks and human-like "knowledge". Each baby Bert model (say #tinyBert) can receive "guided" training as the user input targeted and tokenized sets of data and incorporate into its existing "knowledge space". Most baby Berts can work on an user's personal computer and can be trained 24/7 even in the background.

GPT‑4.1 глазами веб‑разработчика: возможности, интеграция и примеры

В апреле 2025 года OpenAI представила серию моделей GPT‑4.1 – сразу три версии: GPT‑4.1 (полноразмерная) , GPT‑4.1 mini и GPT‑4.1 nano ​. Все они значительно превосходят предшественников (GPT‑4.0, также называемый GPT‑4o, и GPT‑4o mini) по качеству кодирования, следованию инструкциям и работе с длинным контекстом​. Главная сенсация – поддержка контекста до 1 000 000 токенов ​o. Это примерно 8 полных копий кода фреймворка React, которые теперь можно подать модели за один раз​! Для сравнения, у предыдущих GPT-4 максимальный контекст был 128 тысяч токенов. Обновился и «горизонт знаний» – GPT‑4.1 обучен на данных вплоть до июня 2024 года, что уменьшает количество ответов «не знаю» на современные вопросы. GPT‑4.1 (основная модель) – флагман с максимальными возможностями. Она улучшила результаты на множестве бенчмарков: например, решает ~54.6% задач на SWE-bench Verified (стандартный тест по разработке ПО), тогда как оригинальный GPT‑4o справлялся лишь с 33.2%​. Это рекордный показатель для моделей GPT и на 21% превышает результат GPT‑4o. Модель стала лучше генерировать код без лишних правок (доля «лишнего» кода снизилась с 9% до 2%​) и более строго придерживается форматов (например, может вносить правки в виде diff-патчей, а не переписывать файл целиком​). GPT‑4.1 mini – облегчённая модель, которая жертвует лишь небольшой долей качества ради скорости и цены. По многим заданиям mini догоняет или даже превосходит оригинальный GPT‑4.0. В тестах OpenAI «мини» не уступает GPT‑4o по интеллекту , но при этом выдаёт ответ почти вдвое быстрее и на 83% дешевле обходится по стоимости вызова​ (то есть стоимость снижена до ~17% от GPT‑4.0). Для разработчиков это означает, что многие задачи теперь можно решать “бюджетной” версией модели без ощутимой потери качества. GPT‑4.1 nano – новейшая и самая лёгкая модель в семействе, первый «нано»-уровень от OpenAI. Nano – рекордсмен по скорости и цене : как отмечает OpenAI, это «самая быстрая и дешёвая модель за всю историю компании»​. Например, nano возвращает первый токен ответа менее чем за 5 секунд даже если запрос содержит 128k токенов контекста​. Она также поддерживает 1М контекста и показывает неплохой уровень интеллекта: ~80.1% на знаниевом тесте MMLU и 50.3% на задачах GPQA​. Хотя nano уступает «старшим братьям» в сложных размышлениях, она отлично подходит для простых и массовых задач – классификация, автодополнение кода, чат-боты с короткими ответами​. В целом, появление mini и nano даёт веб-разработчикам гибкость: можно выбрать мощную GPT‑4.1 для сложной логики или обработки гигантского документа, а для быстрых откликов или фоновых задач – задействовать nano с минимальными затратами.

habr.com/ru/articles/900904/

ХабрGPT‑4.1 глазами веб‑разработчика: возможности, интеграция и примерыНовая линейка OpenAI GPT‑4.1: миллион токенов и три модели В апреле 2025 года OpenAI представила серию моделей GPT‑4.1 – сразу три версии: GPT‑4.1 (полноразмерная) , GPT‑4.1 mini и...
#ai#gpt#django

🤖 OpenAI представила одразу три нові моделі: GPT-4.1, 4.1 mini і 4.1 nano.

#GPT-4.1 працює швидше і стабільніше в порівнянні з GPT-4 Turbo.
GPT-4.1 mini пропонує вищий інтелект, ніж GPT-4o, і коштує на 83% менше.
GPT-4.1 nano є найшвидшою і найдешевшою моделлю з адекватною якістю.

Ці моделі доступні лише через API для розробників і не призначені для роботи в чаті.
🔗 openai.com/index/gpt-4-1/

Как технологии ИИ трансформируют работу контактного центра на Платформе Эра

В данной статье расскажем про ключевые процессы обслуживания клиентов, и смежные процессы управления — контроль качества и аналитику. Основной акцент сделаем на искусственном интеллекте. Рассмотрим также речевые технологии, вскользь коснемся классических подходов к построению автоматических сервисов. Платформа Эра — это новая информационно-коммуникационная платформа, на базе которой можно строить распределенные IP-АТС, омниканальные контакт-центры и другие корпоративные системы для обработки информационных и коммуникационных процессов. Сервисы GPT В Платформе Эра появилось новое приложение — искусственный интеллект. В одной системе может быть несколько сервисов GPT — как локальных, так и облачных. Сервис определяется адресом сервера и токеном, умеет получать список доступных моделей, позволяет задать настройки по умолчанию для чатов и индексирования. Как минимум, это выбор моделей (так как один сервис часто содержит несколько моделей каждого типа) и температура для генерации текста. Базы знаний Мы можем создавать базы знаний, добавлять к ним документы и индексировать. Поддерживаются наиболее распространенные форматы файлов. Иногда имеет смысл потратить некоторое время на подготовку документов для базы знаний. Например, красивая презентация в формате пдф может некоторыми моделями индексироваться плохо — в качестве контекста будут выбираться страницы, содержащие только заголовок и бесполезную картинку. В таких случаях простые команды Ctrl+A, Ctrl+C, Ctrl+V и построение базы знаний на основе текстового файла существенно повышают качество подготовки контекста. Здесь у нас есть две базы знаний — одна локальная и одна ChatGPT на основе 30-страничного буклета по платформе Эра. Скоро мы посмотрим на практике, как нейросеть отвечает на вопросы по этому файлу.

habr.com/ru/articles/899580/

ХабрКак технологии ИИ трансформируют работу контактного центра на Платформе ЭраВ данной статье расскажем про ключевые процессы обслуживания клиентов, и смежные процессы управления — контроль качества и аналитику. Основной акцент сделаем...

LLMs are sometimes absolutelly useless. I accidentally sent a question to an LLM chatbot (instead of chat in another window) and it responded with absolutely no informations in one screenful.

#llm#gpt#gpt4o

[Перевод] ai-2027.com на русском: концовка по сценарию Замедления

Это алтернативная концовка моего мини-хабра-сериала с переводом нашумевшего Sci-Fi рассказа ai-2027.com . Он написан топовыми ИИ-экспертами, ссылается на кучу данных, имеет две концовки (!) и сейчас все о нём говорят. Эта концовка проиграла на голосовании в конце второй части В предыдущих сериях ...три огромных дата-центра, заполненных копиями Agent-2, работают днем и ночью... ...он предпочитает работать в рамках существующего политического истеблишмента, постепенно укрепляя свою власть... ...они просят Пентагон разработать план кинетических атак на китайские дата-центры... ...быть идеально честным все время — это не то, далее

habr.com/ru/articles/898876/