Scott Wu fra Cognition sier at AI-kodingsagenter ikke bør erstatte mennesker ↗
Scott Wu fra Cognition avviste ideen om at Devin er bygget for å erstatte programmerere fullstendig. En litt merkelig holdning, gitt at selskapet også sier at Devin bruker en stor del av sin egen kode.
Rammeverket hans er mer «kompis, AI-koding» enn «jobben din har blitt spist av en laptop-nisse». Likevel er spenningen vanskelig å overse – bedre agenter, færre unnskyldninger for oppblåste ingeniørteam … i hvert fall det som argumenteres.
Denne AI-oppstarten vil rengjøre hjemmet ditt gratis for å trene fremtidige roboter ↗
Shift tilbyr gratis rengjøring av hjemmet, med en hake som er både praktisk og litt urovekkende: rengjøringspersonalet bruker en kamerautstyrt «magisk hatt» slik at selskapet kan samle inn robottreningsdata.
Salgstilbudet er enkelt – du får en ren leilighet, de får video av husarbeid. Kanskje et skikkelig kupp.
Shift sier at det slører sensitive detaljer og anonymiserer opptak, men det bredere spørsmålet ligger fortsatt der som en sokk under sofaen: hvor mye privatliv hjemme er folk villige til å bytte bort for bekvemmelighet?
Antropiske utgivelser Claude Opus 4.8 ↗
Anthropic rullet ut Claude Opus 4.8 med oppgraderinger på tvers av koding, agentiske arbeidsflyter, resonnement og profesjonelt arbeid. Det store salget er pålitelighet – færre ubegrunnede påstander, bedre verktøybruk og mer selvkontroll.
Claude Code får også dynamiske arbeidsflyter, som lar modellen planlegge, starte parallelle underagenter, verifisere utdata og rapportere tilbake. Det høres tørt ut helt til du innser at det i bunn og grunn er prosjektledelse i trenchcoat.
Prisene forblir delt mellom standard- og raske moduser, med Anthropic som heller mot innsatskontroller slik at brukerne kan avveie hastighet, kvalitet og tokenforbrenning.
Foxconn har enorm tillit til vekstmomentum på grunn av AI, sier styreleder ↗
Foxconns styreleder sa at etterspørselen etter AI endrer selskapets vanlige sesongrytme. Den gamle nedgangen i leverandørbransjen midt i året? Tilsynelatende ikke normalt lenger.
Årsaken er skygigantenes gigantiske AI-utgifter, som Foxconn ser på som sin egen markedsmulighet. Det er maskinvaresiden av AI-boomen, mindre glansfull enn chatbots, men i stor grad der pengeinntektene klirrer.
Foxconn er allerede en stor produsent av Nvidia-servere, så optimismen deres er i utgangspunktet en temperaturkontroll av kappløpet om AI-infrastruktur.
En delt strategibok for pålitelige tredjepartsevalueringer ↗
OpenAI publiserte veiledning om tredjeparts AI-evalueringer, og argumenterte for at tester trenger tydeligere detaljer om hva som ble evaluert, hvordan det ble testet og hva resultatene kan bevise.
Kjernepoenget er overraskende praktisk: evalueringer av frontlinjebasert AI kan ikke bare være gjetting formet som en ledertavle. Evaluatorer må forklare det testede systemet, instruksjoner, sikkerhetstiltak, gyldighetskontroller og hvor påstander stopper.
Det er viktig fordi etter hvert som modeller blir mer agentiske, kan overfladiske tester få systemer til å se tryggere eller sterkere ut enn de er. Lite papirarbeid, energi, store konsekvenser.
Vanlige spørsmål
Er AI-kodingsagenter som Devin ment å erstatte programmerere?
Scott Wu fremstiller AI-kodingsagenter som kodepartnere snarere enn fullverdige erstatninger for menneskelige programmerere. Artikkelen peker imidlertid på en spenning: Devin beskrives også som en som bidrar med en stor andel av Cognitions egen kode. I praksis er konklusjonen at disse verktøyene kan redusere noe av rutinemessig ingeniørarbeid, samtidig som de fortsatt er avhengige av mennesker for vurdering, veiledning og ansvarlighet.
Hvorfor tilbyr Shift gratis rengjøring av hjemmet basert på AI-opplæringsdata?
Shift tilbyr gratis rengjøring av hjemmet fordi de ønsker videodata fra den fysiske verden av husarbeid for å trene fremtidige roboter. Renholdere bruker en kamerautstyrt «magisk hatt» mens de jobber, og produserer opptak som kan hjelpe AI-systemer med å forstå husarbeid. Utvekslingen er klar: kundene får et rent hjem, mens selskapet får data fra private oppholdsrom.
Hvordan håndterer Shift personvern når de samler inn opptak fra rengjøring av hjemmet?
Artikkelen sier at Shift hevder at den visker ut sensitive detaljer og anonymiserer opptak. Det kan redusere noen personvernrisikoer, men det fjerner ikke den bredere bekymringen ved å ta opp inne i folks hjem. For brukerne er det sentrale spørsmålet om bekvemmeligheten med gratis rengjøring føles verdt det nivået av datainnsamling.
Hva er nytt i Claude Opus 4.8?
Claude Opus 4.8 beskrives som forbedrende koding, agentiske arbeidsflyter, resonnement og profesjonelt arbeid. Oppdateringen fokuserer på pålitelighet, inkludert færre ustøttede påstander, sterkere verktøybruk og mer selvkontroll. Claude Code får også dynamiske arbeidsflyter, der modellen kan planlegge, kjøre parallelle underagenter, verifisere utdata og rapportere resultater.
Hvorfor er Foxconns optimisme rundt AI-boom viktig?
Foxconns tillit er viktig fordi den gjenspeiler maskinvaresiden av AI-boomen. Selskapets styreleder sa at etterspørselen etter AI endrer sitt vanlige sesongmønster, med skygigantenes infrastrukturinvesteringer som skaper en stor markedsmulighet. Siden Foxconn allerede er en stor Nvidia-serverprodusent, fungerer kommentarene som et sterkt signal for etterspørselen etter AI-infrastruktur.
Hva sier OpenAI som gjør tredjeparts AI-evalueringer troverdige?
OpenAI argumenterer for at AI-evalueringer trenger tydeligere forklaringer på hvilket system som ble testet, hvordan det ble testet og hva resultatene faktisk viser. Dette inkluderer detaljer om prompter, sikkerhetstiltak, gyldighetskontroller og grensene for eventuelle påstander. Poenget er spesielt viktig for mer agentiske modeller, der overfladiske tester kan få systemer til å virke tryggere eller mer kapable enn de er.