Современные подходы к управлению памятью в AI-инфраструктуре
Почему память становится ключевым элементом в эпоху гипермасштабируемых дата-центров
В последние годы, фокус в обсуждении стоимости инфраструктуры для искусственного интеллекта часто делается на таких гигантах, как Nvidia, специализирующихся на производстве графических процессоров (GPU). Однако важность памяти растет на фоне стремительного увеличения объема данных и необходимости более эффективного их управления.
Рост цен на DRAM
По мере того, как крупные технические компании готовятся инвестировать миллиарды долларов в новые дата-центры, цена на DRAM чипы за последний год увеличилась примерно в семь раз. Это заставляет задуматься о важности оптимизации использования памяти, чтобы обеспечить передачу данных от нужного агента к другой в нужное время.
Важность управления памятью
Дэн О’Лафлин, аналитик в области полупроводников проанализировал ситуацию в статье с участием Вэла Берковици, главного AI-офицера компании Weka. Их анализ сосредоточен на чипах памяти и их воздействии на программное обеспечение для AI. Один из примеров, который они рассмотрели, это усложняющаяся документация по кэшированию подсказок от компании Anthropic.
В частности, стоит отметить, как изменилась страница ценообразования на кэширование подсказок Anthropic. Если раньше это была простая страница с описанием "используйте кэширование, это дешевле", то сейчас это своего рода энциклопедия с советами о том, сколько кэшей следует заранее приобрести. Это включает в себя, к примеру, 5-минутные и 1-часовые интервалы для хранения данных в памяти.
Преимущества оптимизации кэширования
Если данные остаются в кэше, их использование оказывается значительно дешевле. Однако добавление новых данных может вытеснить существующие из кэш-окна. Компании, которые смогут эффективно управлять этим процессом, сократят использование токенов и сделают инференс дешевле. Снижение стоимости серверов позволит многим сейчас кажущимся невыгодными приложениям стать прибыльными.
Одна из компаний, работающих над этой проблемой, — это стартап TensorMesh, занимающийся оптимизацией кэшей. Кроме того, оптимизации в стекe могут осуществляться на разных уровнях — от выбора типа памяти, используемой дата-центрами, до структурирования моделей для совместного использования кэша.
События и возможности
23 июня в Бостоне состоится TechCrunch Founder Summit 2026, где более 1,100 основателей соберутся, чтобы обсудить рост и реальные пути масштабирования бизнеса. Участники мероприятия смогут перенять опыт у лидеров индустрии и улучить свои тактики.
На саммите будут представлены способы эффективного использования памяти, которая и дальше будет играть ведущую роль в развитии AI-технологий. Компании, которые значительно преуспеют в этой области, смогут вырваться в лидеры рынка.