Автор: Зик, исследователь YBB Capital
1. Предпочтение новому и нелюбовь к старому, начинающаяся с внимания
В прошлом году сфера шифрования постепенно превратилась в игру за внимание ресурсов из-за неспособности описания уровня приложений соответствовать скорости бурного развития инфраструктуры. От Silly Dragon до Goat, от Pump.fun до Clanker — битва за внимание разгорается повсюду. Начав с самой банальной и привлекательной реализации, она быстро сменилась платформенной моделью, в которой были объединены те, кто требует внимания, и поставщики, а затем кремниевые организмы стали новыми поставщиками контента. Среди различных странных носителей Meme Coin наконец-то появился объект, который может позволить розничным инвесторам и венчурным инвесторам достичь консенсуса: AI Agent.

В конечном счете внимание — это игра с нулевой суммой, но спекуляции действительно могут свести ситуацию с ума. В нашей статье о UNI мы рассмотрели начало последней золотой эры блокчейна. Причина быстрого роста DeFi возникла в эпоху LP-майнинга, начатую Compound Finance, который осуществлялся в различных майнинговых пулах с тысячами или даже десятками. тысяч Apy In and Out был самым примитивным способом игры в сети в тот период, хотя в конечном итоге различные майнинговые пулы рухнули и покрылись перьями. Однако сумасшедший приток золотодобывающих компаний действительно оставил беспрецедентную ликвидность в блокчейне, наконец, оторвавшись от чистых спекуляций и сформировав зрелую систему, удовлетворяющую пользователей во всех аспектах, таких как платежи, торговля, арбитраж и финансовые потребности. На данном этапе AI Agent также проходит через эту варварскую стадию. Мы изучаем, как Crypto может лучше интегрировать AI и, в конечном итоге, поднять уровень приложений на новую высоту.
2. Как интеллектуальный агент становится автономным?
В нашей предыдущей статье мы кратко рассказали о происхождении AI Meme: Truth Terminal и нашем взгляде на будущее AI Agent. В этой статье основное внимание уделяется самому AI Agent.
Начнем с определения агента ИИ. Агент — это старый, но неясно определенный термин в области ИИ. Его основной упор делается на автономный, то есть любой ИИ, который может воспринимать окружающую среду и отражать, может называться агентом. В сегодняшнем определении AI Agent ближе к интеллектуальному агенту, то есть созданию системы для большой модели, имитирующей принятие решений человеком. В академических кругах эта система рассматривается как наиболее многообещающий способ AGI (Общего искусственного интеллекта). .
В ранней версии GPT мы могли ясно видеть, что большая модель очень похожа на человека, но при ответе на многие сложные вопросы большая модель могла дать лишь некоторые ложные ответы. Основная причина заключается в том, что большая модель в то время была основана на вероятности, а не на причинно-следственной связи. Во-вторых, у людей не было возможности использовать инструменты, память, планирование и т. д., и агент ИИ может компенсировать эти недостатки. Итак, подведем итог по формуле: AI Agent (интеллектуальный агент) = LLM (большая модель) + Planning (планирование) + Memory (память) + Tools (инструменты).

Большая модель, основанная на словах-подсказках (Подсказка), больше похожа на статического человека. Она оживает, когда мы ее вводим, и целью интеллектуального агента становится более реальный человек. Сегодняшние интеллектуальные агенты в кругу в основном представляют собой точно настроенные модели, основанные на версии Meta с открытым исходным кодом Llama 70b или 405b (обе имеют разные параметры). Они способны запоминать и использовать инструменты доступа к API, но могут требовать помощи человека или участия других). аспекты (включая взаимодействие и сотрудничество с другими агентами), поэтому мы видим, что основные агенты в круге сегодня все еще существуют в социальных сетях в форме KOL. Чтобы сделать интеллектуального агента более похожим на человека, он должен иметь доступ к возможностям планирования и действий, а цепочка подмышлений при планировании особенно важна.
3. Цепочка мыслей (ЦТ)
Концепция цепочки мыслей (CoT) впервые появилась в статье «Цепочка мыслей, побуждающая к рассуждениям в моделях большого языка», опубликованной Google в 2022 году. В документе указывается, что модель можно улучшить, создав серию промежуточных Возможности рассуждения помогают моделям лучше понимать и решать сложные проблемы.

Типичная подсказка CoT состоит из трех частей: четкие инструкции, описание задачи, логическая основа, теоретическая основа или принципиальный пример для поддержки решения задачи и демонстрация конкретного решения. Этот структурированный подход помогает модели понять требования задачи и постепенно приближаться к ним посредством логических рассуждений. . ответы, тем самым повышая эффективность и точность решения проблем. CoT особенно подходит для задач, требующих углубленного анализа и многоэтапного рассуждения, таких как решение математических задач, написание отчета по проекту и других простых задач. CoT может не принести очевидных преимуществ, но для сложных задач он может значительно повысить производительность. модели, посредством пошаговых стратегий решения уменьшают количество ошибок и улучшают качество выполнения задач.
При создании ИИ-агента CoT играет ключевую роль. ИИ-агенту необходимо понимать полученную информацию и принимать на ее основе разумные решения. и трансформировать результаты анализа в. Такой подход не только повышает надежность и эффективность принятия решений Агентом, но и повышает прозрачность процесса принятия решений, делая поведение Агента более предсказуемым и отслеживаемым, помогает CoT за счет разложения задач на мелкие. шаги. Каждая точка принятия решения тщательно рассматривается, чтобы уменьшить количество ошибочных решений, вызванных информационной перегрузкой, что делает процесс принятия решений Агентом более прозрачным и облегчает пользователям понимание основы принятия решений Агентом. Взаимодействуя с окружающей средой, CoT позволяет Агенту постоянно изучать новую информацию и корректировать поведенческие стратегии.
В качестве эффективной стратегии CoT не только улучшает возможности рассуждения больших языковых моделей, но также играет важную роль в создании более интеллектуальных и надежных агентов ИИ. Используя CoT, исследователи и разработчики могут создавать интеллектуальные системы, которые лучше адаптируются к сложным средам и обладают высокой степенью автономности. CoT продемонстрировал свои уникальные преимущества в практических приложениях, особенно при решении сложных задач. Разбивая задачу на серию небольших шагов, он не только повышает точность решения задач, но также повышает интерпретируемость и управляемость модели. . Этот пошаговый подход к решению проблем может значительно уменьшить количество ошибочных решений, вызванных слишком большим количеством или слишком сложной информацией при решении сложных задач. В то же время этот подход также улучшает отслеживаемость и проверяемость всего решения.
Основная функция CoT — объединить планирование, действие и наблюдение, устраняя разрыв между рассуждениями и действиями. Этот режим мышления позволяет ИИ-агенту формулировать эффективные контрмеры при прогнозировании нештатных ситуаций, которые могут возникнуть, а также накапливать новую информацию при взаимодействии с внешней средой, проверять заданные прогнозы и обеспечивать новую основу для рассуждений. CoT — это мощный механизм точности и стабильности, который помогает агентам ИИ поддерживать эффективную работу в сложных средах.
4. Исправьте псевдопотребности
С какими аспектами стека технологий искусственного интеллекта будет интегрирована Crypto? В прошлогодней статье я считал, что децентрализация вычислительных мощностей и данных является ключевым шагом, который поможет малому бизнесу и отдельным разработчикам сэкономить средства. В сегментированном треке Crypto x AI, организованном Coinbase, мы увидели более детальное разделение:
(1) Вычислительный уровень (относится к сети, ориентированной на предоставление ресурсов графического процессора (GPU) разработчикам ИИ);
(2) Уровень данных (относится к сети, которая поддерживает децентрализованный доступ, оркестровку и проверку конвейеров данных ИИ);
(3) уровень промежуточного программного обеспечения (относится к платформе или сети, которая поддерживает разработку, развертывание и размещение моделей или агентов ИИ);
(4) Прикладной уровень (относится к ориентированным на пользователя продуктам, которые используют внутрисетевые механизмы искусственного интеллекта, будь то B2B или B2C).
Каждый из этих четырех уровней разделения имеет грандиозное видение, и все его цели заключаются в борьбе с новой эрой гигантов Кремниевой долины, доминирующих в Интернете. Как я сказал в прошлом году, действительно ли нам нужно признать исключительный контроль над вычислительными мощностями и данными со стороны гигантов Кремниевой долины? Большая модель с закрытым исходным кодом, находящаяся под их монополией, представляет собой черный ящик внутри. Наука — самая популярная религия человечества сегодня. В будущем каждое предложение, на которое отвечает большая модель, будет считаться истиной большим количеством людей, но это. правда должно Как проверить? Согласно видению гигантов Кремниевой долины, интеллектуальные агенты в конечном итоге будут обладать невообразимыми разрешениями, такими как право платить в своем кошельке и право использовать терминалы. Как гарантировать, что у людей не будет злых намерений?
Децентрализация — единственный ответ, но нужно ли иногда нам разумно и всесторонне проанализировать, сколько покупателей есть на эти грандиозные идеи? Раньше мы могли использовать Token для компенсации ошибок, вызванных идеализацией, не принимая во внимание коммерческий замкнутый цикл. Сегодняшняя ситуация очень серьезна, и Crypto x AI необходимо разрабатывать с учетом реальной ситуации. Например, как можно сбалансировать два конца уровня вычислительной мощности, когда производительность потеряна и нестабильна? Чтобы соответствовать конкурентоспособности централизованного облака. Сколько реальных пользователей будет в проекте уровня данных? Как проверить реальную достоверность предоставленных данных? Каким клиентам нужны эти данные? То же самое относится и к двум другим уровням. В эту эпоху нам не нужно так много, казалось бы, правильных псевдопотребностей.
5. У Мема закончился доступ к SocialFi
Как я уже говорил в первом абзаце, Meme разработал форму SocialFi, которая очень быстро соответствует Web3. Friend.tech был первым децентрализованным приложением, запустившим этот раунд социальных приложений, но он потерпел поражение из-за энергичного дизайна токенов. Pump.fun подтвердил возможность создания чистой платформы без каких-либо токенов и правил. Соискатели и поставщики внимания едины. Вы можете публиковать мемы, проводить прямые трансляции, выпускать монеты, оставлять сообщения и торговать на платформе. Pump.fun взимает только комиссию за обслуживание. Это в основном соответствует модели экономики внимания в современных социальных сетях, таких как YouTube и Instagram, за исключением того, что объекты зарядки другие, а игровой процесс Pupm.fun больше похож на Web3.

Base's Clanker — мастер всего. Благодаря интегрированной экологии, которой лично управляет экология, у Base есть собственное социальное приложение, помогающее сформировать полный внутренний замкнутый цикл. Intelligent Meme — это версия Meme Coin 2.0. Люди всегда ищут новые идеи, и Pump.fun сейчас находится в авангарде тренда. Судя по тренду, появление случайных идей — лишь вопрос времени. Организмы на основе кремния заменяют вульгарные мемы об организмах на основе углерода.
Я упоминаю Base уже в который раз, но содержание упоминания каждый раз разное. Судя по хронологии, Base никогда не был первопроходцем, но всегда оказывался в выигрыше.
6. Каким еще может быть интеллектуальный агент?
Я уже в который раз упоминаю Base, но содержание упоминания каждый раз разное. Судя по хронике, Base никогда не был первопроходцем, но всегда оказывался в выигрыше.
6. Каким еще может быть интеллектуальный агент?
С прагматической точки зрения, децентрализация агентов в течение длительного времени невозможна. Судя по конструкции агентов в традиционной области ИИ, ее нельзя решить простой децентрализацией процесса рассуждения и открытым исходным кодом. Проблема. заключается в том, что для доступа к контенту Web2 требуется доступ к различным API, а его эксплуатационные расходы очень высоки. Конструкция цепочки мышления и сотрудничество нескольких агентов обычно по-прежнему полагаются на человека в качестве среды. Нам предстоит пройти длительный переходный период, пока не появится подходящая форма интеграции, возможно, такая как UNI. Но, как и в предыдущей статье, я по-прежнему думаю, что интеллектуальные агенты окажут большое влияние на нашу отрасль, так же, как и существование Cex в нашей отрасли, что неверно, но важно.
В статье «Обзор AI-агента», опубликованной Stanford & Microsoft в прошлом месяце, подробно описывается применение агентов в медицинской промышленности, интеллектуальных машинах и виртуальных мирах. В приложении к этой статье уже есть много GPT-4V, участвующих в качестве агентов. Тестовый пример разработки игр топ-3А.
Нет необходимости настаивать на скорости его сочетания с децентрализацией. Я надеюсь, что первая часть головоломки, которую сможет решить разумный агент, — это способность и скорость снизу вверх. У нас так много повествовательных руин и пустых метавселенных, которые нужно решить. быть заполнен. На соответствующем этапе мы рассмотрим, как сделать его следующим UNI.
Все комментарии