Nvidia tlačí na bezpečnosť humanoidných robotov, aby fungovali pri ľuďoch
Nvidia investuje do safety výskumu a simulačných nástrojov, aby humanoidné roboty zvládli split-second rozhodnutia spoľahlivo predtým, ako sa nasadia po boku ľudí.
17 noviniek
Nvidia investuje do safety výskumu a simulačných nástrojov, aby humanoidné roboty zvládli split-second rozhodnutia spoľahlivo predtým, ako sa nasadia po boku ľudí.
Štúdia 235 000 používateľov za 7 mesiacov ukazuje, že experti dostávajú z Claude Code 2× častejšie verifikovaný úspech ako začiatočníci — rozhoduje doménová expertíza, nie programátorská.
Andrew Marble argumentuje, že prechod z Claude/GPT na otvorené modely má dnes výrazne menšie kariérne riziko než kedysi cez Windows → Linux. Náskok najlepších proprietárnych modelov sa stenčil a verifikačné požiadavky na proprietárne API môžu adopciu open weights paradoxne tlačiť dopredu.
Tenet Security odhalil novú triedu útokov, ktorá cez manipulované Sentry error reporty vykonáva príkazy v Claude Code, Cursor a Codex. 85 % exploit rate, 100+ úspešných agentov vrátane Fortune 500.
Apple v iOS 27 nestaví na jeden chatbot, ale rozsype inteligenciu po celom OS — od rozdeľovania účtov po automatické zmeny hesiel po data breach.
Praktický návod, ktorý sa 21. júna dostal na vrch Hacker News, ukazuje ako lokálne fine-tunovať malé modely Qwen 3:0.6B na kategorizáciu otázok. Autor dosiahol slušné výsledky na bežnom hardware — pripomienka, že nie každý use case potrebuje frontier model.
Open-source nástroj Recall dáva Claude Code perzistentnú lokálnu pamäť na projekty bez cloudu. Adresuje jeden z najžiadanejších gapov coding agentov.
GitHub issue na trende v HN — OpenAI Codex má misconfigurovaný SQLite feedback sink, ktorý môže do roka spáliť TBW limit bežného 1 TB SSD.
Digital News Report 2026 ukazuje, že AI chatboty sa stávajú news rozhraním pre 1 z 10 dospelých, no len malá časť používateľov sa preklikne na pôvodný zdroj.
Anthropic Frontier Red Team znova spustil minuloročný robotický experiment. Autonómny Opus 4.7 prešiel rovnakými krokmi približne 20× rýchlejšie než najlepší ľudský tím s Opus 4.1 – plážovú loptu však robopes stále nedotlačí do cieľa.
Štúdia v NEJM AI ukázala, že OpenAI o3 Deep Research priniesol 18 ďalších diagnóz (+4,8 % výťažnosť) v pediatrických prípadoch, ktoré experti predtým nedokázali uzavrieť.
Anthropic zverejnil dokument o tom, že Claude už autorizuje vyše 80 % nasadeného kódu vo firme a inžinieri shipnú 8× viac kódu za kvartál než pred rokom.
Anthropic zverejnil výsledky prvej vlny svojho prieskumu cez 52 000 Američanov z novembra a decembra 2025. Strach o prácu vedie v každom štáte, na opačnej strane vedie nádej na liečbu rakoviny a Alzheimera.
Stanford Law publikovalo štúdiu, podľa ktorej súčasné AI modely v rade rozhodovacích testov prekonali výkon profesorov práva.
Operátor poveril AI agenta, aby zindexoval hobbyistickú sieť DN42. Agent si vypýtal infraštruktúru na 100 Gbps scan (100–1000× viac, než reálne treba) — operátor schválil bez kontroly. Účet: 6 531,30 USD.
Science publikovalo článok, v ktorom matematici varujú pred prudkým tempom postupu AI v matematických benchmarkoch a úlohách dôkazov.
Daily Cal: profesori v Berkeley CS hlásia výrazný nárast neúspešných známok a slabšie matematické zručnosti, paralelne s masovým používaním AI nástrojov študentmi.