fbpx
Изкуствен интелектНаука и технологии

„Най-умният ИИ на планетата“ Grok-3 на Илон Мъск – пробив или пореден маркетингов ход?

Преди три дена компанията xAI презентира новата версия на своя изкуствен интелект Grok – Grok 3, която самият Илон Мъск определи като „най-умния ИИ на планетата“ . Какво ново има в новата версия и какво показват първите тестове на модела. Дали действително това е пробив в областта на изкуствения интелект или поредния маркетингов ход на Мъск?

Времената на поредните “убийци на iPhone” минаха. Сега новите технологични продукти щурмуват друга висока летва – опитват се да надминат Chat GPT. Последният претендент за ролята на най-умния ИИ на планетата влезе Grok-3, който съвсем наскоро беше представен от компанията xAI, основана от Илон Мъск.

В какво е силата на Grok?

За да успеете на все по-наситения пазар на изкуствен интелект, е важно да предложите нещо уникално на потребителя. Китайският ИИ модел DeepSeek привлече с безплатен достъп, Claude от Anthropic е известен със своя философски подход, Gemini от Google може да работи с видео. Ами Grok? Той има три коза наведнъж.

Първо, принципиално няма цензура. Ако Deepseek следва предписанията на Китайската комунистическа партия, а Chat GPT, Claude, Gemini и Copilot следват правилата за политическа коректност, то Grok демонстративно ги нарушава. Иронията е в това, че моделът често е критикуван, че разпространява дезинформация.

Второ, Grok, според самия Илон Мъск, ще бъде използван в космическите полети до Марс. Това изглежда по-скоро като хубав психологически бонус за феновете на SpaceX.

И трето, ако се върнем от небето на земята, той има изчислителна мощност, която надвишава своя предшественик (Grok 2) повече от 10 пъти. Преведено от маркетингов на човешки език, това означава, че за обучението на модела е използван суперкомпютър с 200 хиляди графични процесора вместо досегашните 20 хиляди.

Според xAI Grok-3 превъзхожда GPT-4o, Google Gemini и DeepSeek V3 в задачите за математически изчисления, естествените науки и програмирането. И това звучи доста правдоподобно. В края на краищата предишната версия на Grok вече демонстрира много добри резултати във визуалния математически анализ, тоест способността на модела да разбира и решава проблеми, които изискват анализиране на графики, диаграми и уравнения.

Какво е новото във версията Grok-3

Новият Grok-3 всъщност не е един, а цели четири модела.

Grok-3 е базовият модел с основен набор от функции;

Grok-3 Mini – олекотена версия, която осигурява по-бърза работа с известна загуба на прецизност;

Grok-3 Reasoning – модел, специално създаден за задълбочен анализ, който да превъзхожда другите модели в тестовете по математика и програмиране;

Grok-3 Mini Reasoning е олекотена версия на модела с разширени аналитични възможности.

Всички модели са налични в мобилното приложение Grok и предлагат на потребителите два нови режима на работа.

Режим Think е предназначен за стандартни заявки и ежедневна употреба, и активира функцията за разсъждение за по-задълбочен анализ.

Режим Big Brain е оптимизиран за сложни изчисления, научни изследвания и програмиране; осигурява по-висока точност на отговорите чрез използване на допълнителни изчислителни ресурси.

И двата режима са налични във всичките четири варианта на модела, предназначени да осигурят по-фино персонализиране и да помогнат за адаптиране на производителността на ИИ за конкретни задачи.

• Например, ако искате просто да проверите новините или да получите бърз отговор на конкретен въпрос, можете да изберете Grok-3 Mini в режим Think.

• Ако трябва да направите сложен анализ на данни или да решите математически проблем, можете да активирате Grok-3 Reasoning в режим Big Brain и да отделите повече време и ресурси за обработка на заявката.

• Ако имате нужда от оптимален баланс между разходи за ресурси и качество, можете да използвате Grok-3 в режим Think.

В близко бъдеще компанията планира да добави гласов режим към приложението, аналогичен на Advanced Voice Mode на ChatGPT, който ще позволи на потребителите да дават на ИИ команди с глас и да получават гласови отговори.

Цената

Ситуацията тук не е съвсем ясна. За достъп до функционалностите на Grok-3 се нуждаете от платен абонамент за X Premium+. Цената му наскоро бе увеличена и в момента варира от $40 до $50 на месец в зависимост от региона.

Освен това, от xAI обявиха нов план SuperGrok за $30 на месец или $300 на година, осигуряващ “най-модерните възможности” и “най-ранен достъп до нови функции”, но кои точно, все още не е уточнено. Допълнителна несигурност е фактът, че компанията все още не е казала дали SuperGrok ще бъде допълнително плащане към абонамента X Premium+ или отделен план.

Тестове „“на терен“

Отзиви за новия модел бяха публикувани от много онлайн издания. Тестовете, който изглеждат най-близки до реалните нужди на средния потребител, са сякаш тези, проведени от рецензента на техническия портал Tom’s Guide Аманда Касуел.

Ето резултати от него:

Тест 1 Квантова физика на една ръка разстояние

Режим Think

Стандартен модел Grok-3

За да тества способността на Grok 3 да разбира и обяснява сложни концепции, Аманда е попитала модела:

„Обясни ми на обикновен език какво е квантово заплитане“.

Отговори на Grok-3 на този и следващите тестове можете да видите тук.

Преценете сами доколко просто и ясно Grok 3 може да обясни нещата. Ето превод на първата част от неговия отговор:

„Квантовото заплитане е един от най-удивителните и сложни феномени на квантовата механика. Това се случва, когато две или повече частици се свържат, така че техните състояния вече не са независими, дори ако са много отдалечени една от друга. Това означава, че свойствата на една частица (като нейната позиция, импулс или спин) са пряко свързани със свойствата на друга, независимо от разстоянието между тях.”

За илюстрация Grok 3 дори сравнява заплетени частици със сиамски близнаци, които незабавно реагират един на друг – „независимо от разстоянието“. Но това е повече мистика, отколкото наука. Много по-хармонична аналогия би била с два синхронизирани часовника: гледайки единия, вие знаете точно колко часа показва другият, дори ако е в друга галактика. Освен това отговорът на Grok 3 не е предоставил никакви връзки към източника.

Тест 2 Дълбоко търсене

• Режим Think

• Модел Grok-3 Reasoning

Втората опция при теста е била DeepSearch. Deep Search е друга ключова иновация на Grok 3. Целта на този инструмент е да се конкурира с търсачките на конкурентите чрез извършване на интелигентни търсения в открити източници в мрежата, анализиране на големи обеми информация и предоставяне на кратки аналитични обобщения.

При този тест Grok-3 е бил с активирана опция DeepSearch, като заявката е била:

„Направи ми бърз преглед на последните изследвания в областта на възобновяемите източници на енергия, публикувани през последния месец.“

Grok-3 бързо е събрал информация от множество източници и дал отговор, който обхващал множество изследователски области, включително стратегии за интегриране на ИИ в енергосистемата. Тази широта на покритие е демонстрация за дълбоко разбиране на контекста, отбелязва Аманда Касуел.

Но имало и някои пропуски. В отговора не били предоставени никакви препратки към конкретни изследвания, публикации или данни, свързани с последния месец ( от средата на януари до средата на февруари 2025 г.). Вместо това ИИ използвал неясни фрази като „изследванията продължават“ и „изглежда са разработени нови методи“.

Тест 3 Мозъчна атака

Режим Big Brain

Модел Grok-3 Reasoning

За да се тестват аналитичните възможности на Grok 3, избраната заявка била:

„Анализирай икономическите последици от въвеждането на базов доход в развитите страни“.

Grok-3 се справил със задачата достатъчно добре , като разгледал плюсовете и минусите на подхода и предоставил връзки към изследователски и пилотни програми. Но той се съсредоточил преди всичко върху краткосрочните ефекти от въвеждането на базов доход, като оставил без внимание дългосрочните последици.

Тест 4 Генериране на изображения

Режим Big Brain

Модел Grok-3

За създаването на изображения в Grok 3 отговаря вградената невронна мрежа Aurora, която също получила редица актуализации. На първо място, това е бил подобрения фотореализъм, особено при създаване на детайлни пейзажи. И изненада – появила се „етична рамка“. За първи път в Aurora има ограничения върху създаването на изображения, свързани с насилие, секс и други „чувствителни теми“.

Тестовата заявка не била свързана с такива теми. Grok 3 бил помолен да създаде фотореалистично изображение на футуристичен град при залез слънце.

Футуристичните градски пейзажи на Grok 3 се отличавали с впечатляващ фотореализъм, реалистични светлинни ефекти и разнообразие от ъгли и перспективи, но например нямало такива футуристични елементи като летящи коли. Освен това, както отбелязва колумниста, им липсвала креативност и интелектуална смелост.

Моделът създал няколко красиви изображения с добра детайлност, реалистично осветление и атмосферни ефекти. Въпреки това, авторът на рецензията пише, че въпреки цялата техническа безупречност, изображенията нямат наистина футуристични елементи. Изглежда, че системата целенасочено преследва консервативна визия за бъдещето.

Това пробив ли е?

По-скоро това е добра основа за бъдещето, смятат експертите. Grok-3 наистина върши добра работа за анализиране на сложни проблеми и обясняване на научни концепции по разбираем начин. Силните му страни са логическата структура на отговорите, обширният контекст и способността да се изследват темите в дълбочина. Има и слабости, като липса на препратки към авторитетни източници, едностранен подход и проблеми с креативността при генериране на изображения. Но проблемът даже не в това.

Grok 3 проявява същия фундаментален недостатък като своите конкуренти. Без значение колко убедително и интелигентно отговаря той, все пак ще трябва да отделите известно време за самостоятелна проверка на информацията, а това най-вероятно ще сведе ползата от използването на интелигентния асистент до минимум. Така че твърденията на Илън Мъск за „страхотната интелигентност“ на новия модел изглеждат преждевременни.

0 0 votes
Article Rating
Subscribe
Notify of
guest
0 Comments
oldest
newest most voted
Inline Feedbacks
View all comments

Харесайте ни :-)


This will close in 25 seconds

0
Would love your thoughts, please comment.x
()
x