Meta, dříve známá jako Facebook, je jednou z největších a nejvlivnějších technologických společností na světě. Její hlavní produkty zahrnují sociální sítě, virtuální a rozšířenou realitu, chytré brýle a další.
Meta také investuje do výzkumu a vývoje umělé inteligence (AI), která je klíčovou součástí její vize vytvořit metaverse – společný virtuální prostor, kde lidé mohou komunikovat, spolupracovat a tvořit.
V tomto článku se podíváme na některé z nejnovějších a nejzajímavějších projektů a iniciativ společnosti Meta v oblasti AI, které ukazují její ambice, schopnosti a odpovědnost.
Generativní AI
Generativní AI (konkurenční ChatGPT, Gemini od Googlu) je typ AI, který dokáže vytvářet nový obsah, jako jsou texty, obrázky, zvuky nebo videa, na základě zadaných podmínek nebo vstupů. Meta využívá generativní AI k vytváření nových zážitků a nástrojů pro své uživatele, kteří jim umožňují bavit se, spojovat se a učit se něco nového.
Některé z příkladů generativní AI od Meta jsou:
- Meta AI: asistent, se kterým můžete chatovat 1 na 1 nebo posílat zprávy ve skupinových chatech. Může vám dělat doporučení, pobavit vás vtipem, rozhodnout spor ve skupině nebo vám prostě odpovědět na otázky nebo vás něco naučit.
- Reels: funkce, která vám pomůže rozhodnout se o místech, která chcete navštívit na základě video recenzí, naučit se nový tanec s tutoriály nebo vám dát inspiraci pro váš projekt.
- Imagine: funkce, která vám umožní popsat obrázek, který chcete vygenerovat – jako například “představ si kočičí vílu v duhovém lese” – a sledovat, jak se vaše představa stane skutečností. Můžete také vylepšovat tyto obrázky s přáteli s funkcí reimagine.
- Restyle a Backdrop: funkce, které vám umožní aplikovat nové vizuální styly na vaše fotky tím, že popíšete efekt, který chcete použít. Stačí napsat popis jako “grunge” nebo “akvarel” a restyle použije nový vzhled a pocit na váš obrázek, zatímco backdrop změní scénu nebo pozadí.
- Audiobox: funkce, která vám umožní generovat zvuk z hlasu a přirozených jazykových podnětů. Můžete například vytvořit vlastní písničku, zvukové efekty nebo podcast.
Meta také sdílí své generativní AI modely a nástroje s výzkumnou a vývojářskou komunitou, aby podpořila spolupráci a inovaci. Například Llama 2, její otevřený zdrojový velký jazykový model, je nyní zdarma a k dispozici pro výzkum a komerční použití. Tento model nabízí jedinečnou příležitost pro vývojáře, zatímco odráží její závazek k otevřenosti, spolupráci a inovaci.
Počítačové vidění
Počítačové vidění je typ AI, který dokáže rozpoznávat, analyzovat a zpracovávat vizuální informace, jako jsou obrázky, videa nebo 3D scény. Meta využívá počítačové vidění k vytváření nových způsobů interakce a prohlubování propojení mezi lidmi a jejich okolím.
Některé z příkladů počítačového vidění od Meta jsou:
- Ray-Ban Meta: chytré brýle, které vám umožňují snímat fotky a videa, poslouchat hudbu, telefonovat nebo používat hlasového asistenta. Tyto brýle také využívají počítačové vidění k rozpoznávání gest, kterými můžete ovládat své funkce.
- Ego-Exo4D: základní dataset pro výzkum na učení videa a multimodálního vnímání. Tento dataset obsahuje více než 100 hodin videa natočených z pohledu první osoby a doprovázených zvukem, akcelerometrem, gyroskopem a magnetometrem. Tento dataset pomáhá výzkumníkům zkoumat, jak AI může lépe porozumět a reagovat na složité a dynamické situace.
- Mind-reading AI: AI systém, který dokáže skenovat lidský mozek a rychle replikovat obrázky, o kterých člověk přemýšlí, pomocí umělé inteligence. Tento systém používá funkční magnetickou rezonanci (fMRI) k měření krevního průtoku v mozku a neuronální sítě k rekonstrukci vizuálních scén.
Meta také sdílí své počítačové vidění modely a nástroje s výzkumnou a vývojářskou komunitou, aby podpořila spolupráci a inovaci. Například Detectron2, její otevřený zdrojový framework pro objektovou detekci a segmentaci, je nyní k dispozici pro výzkum a komerční použití. Tento framework nabízí špičkový výkon, flexibilitu a modularitu pro různé úlohy počítačového vidění.