мне кажется скоро будет edge инференс

я уже рассуждал на то, нужно ли качество для инференс облака hosting.show/alice2k-hosting/trebuetsya-li-inferens-oblaku-rezervirovanie-.html

но так же справедливо заметить, что спрос просит заказать «серверы ближе к какой-то модели»
сами ДЦ где основный файлы модели — США по большей части и они еще не успели сделать свои CDN по всему миру и локальный кеш как делает Гугл к своим сервисам
думаю к 2028 году все кто сейчас продает ИИ по подписке — уже самостоятельно сделают такое и партнерство по миру

но а сейчас что?
вот чувак хочет сервак который быстро работает по связности и не банится тем более
ему можно предложить только европейские ДЦ, да еще и не каждая компания там работает, многие европейские хостеры просто заблокированы их сети в ИИ сервисах

так же взять РФ — которая вообще блокирует зарубеж
получается даже если в РФ кто-то захочет сделать быстрый инференс, ему нужно
1. найти в РФ провайдера или ДЦ который хорошо работает с каким-то зарубежным провайдером
2. тот зарубежный должен хорошо работать с ИИ по связности или находиться по geo рядом

это и называется EDGE не так ли?
получается что есть некий спрос на локальные гео, но только не в привычном его понимании аля cdn, а именно как EDGE GPU или EDGE ИИ
приживется ли такая абривиатура? или слишком мудрено как-то выглядит. как называть сервис который предоставляет локальные ресурсы внутри определенной страны под «инференс кеш»?

конверсия из ИИ-трафика уже обгоняет традиционные каналы - так ли это ?



в тот момент как людям стали платить за контент — контент или блоги честные умерли
раньше было такое понятие как UGC, но потом его просто уничтожили сами площадки которые ради рекламы начали делать платные корпоративные блоги аля тот же хабр как менялся за 15 лет

или взять поисковики которые заросли рекламой, а потом заросли цензурой и все стало удаляться оттуда
или взять социальные сети которые так же сначала похоронили все форумы прошлого, а потом взяли и проиграли законам и стали мусоркой глобальной, а не «единым лучшим местом для всей земли и землян»

тоже самое может случиться и с помощниками ИИ, сейчас их функция объективна и непредвзята. но их могут заставить рекламировать нужные товары и тогда революции никакой не случится. все зависит от того во что превратят наших помощников создатели.

требуется ли инференс облаку резервирование ?

как мы уже знаем, сейчас клиентами дата-центров становятся алгоритмы, а не люди
hosting.show/alice2k-hosting/mozhno-li-schitat-chto-seychas-klientam-oblakov-vmesto-lyudey-stali-algoritmy-.html
hosting.show/alice2k-hosting/dumayu-aktualno-dobavlyat-v-mire-hostinga-esche-professiyu-testirovschik-prilozheniy-dlya-serverov-i-oblakov.html
hosting.show/alice2k-hosting/400-gigov-na-telegu.html

поэтому вопрос о отказоустойчивости можно задать «по новому»

запускать ML модели на даче? но на крутейшем оборудовании
или в сертифицированном цоде?
есть ли разница?

ML это ведь сервис который можно включить и выключить
это скорее как RDP для клиента или прерываемая виртуалка

конечно если модель постоянно обучается ей нужен аптайм
но если это прослойка и лишь средство общения с клиентскими задачами — даже если она сгорит вместе с данными, можно ее заново запустить

мне кажется под ML идеально заходят любые ДЦ «пока не сгорят»
а т.к. алгоритмы побеждают людей, то возможно реально отказоустойчивые ДЦ станут нужны еще меньшему числу клиентов

почему в этом случае CPU превосходит GPU ?

помните я писал, что пора делать новую профессию
hosting.show/alice2k-hosting/mozhno-li-schitat-chto-seychas-klientam-oblakov-vmesto-lyudey-stali-algoritmy-.html

так вот, почему эти люди НЕ ПОКУПАЮТ GPU облака?
казалось бы ПОЧЕМУ БЛЯТЬ
нахуя тебе процессоры когда куча GPU доступно

и вот, я подумал
что скорее всего в ИИ отрасли есть такой же тип людей, как и в хостинг отрасли
который просто научился что-то делать и научился зарабатывать — в 1 человека и больше он не умеет, ОН ПРОСТО НЕ УМЕЕТ РАБОТАТЬ С GPU — поэтому и нужна новая профессия

допустим вот в хостинге чтобы миллиард оборота сделать на реселлинге — 3 чела достаточно
допустим чтобы заработать миллион прибыли достаточно одной дачи и — 1 человека
тд тд
так вот и с ИИ отраслью тоже самое — одиночки блять ходят по рынку и скупают процессоры, просто потому что ДРУГОГО они не умеют и у них нет команды и разнообразия умений

Пробуем сделать GPU вирталки

Вчера купили сервер


Но он завис
Я спецом не стал писать тикет
И где-то ночью только он активировался, часов 10 короче заняла активация

А сегодня купил сеть
Там у них что мне не нравится — КУЧА ЛОКАЦИЙ
И сетки можно купить только на локацию.
В итоге дешевле всего покупать сетку на 256 — но не факт что дедики будут в этой локации всегда.

Ну и еще на сервер только 4 IP добавляется например
Итого — тоже ограничения как в ОВХ.
Значит минимальная ВМ может быть только на 16 озу, а не на 8 озу.


По результатам теста потом напишу