Gaan na inhoud

OpenAI Codex

in Wikipedia, die vrye ensiklopedie

OpenAI Codex is 'n kunsmatige intelligensiemodel wat deur OpenAI ontwikkel is en natuurlike taal in kode vertaal, 'n tegnologie wat deur kunsmatige intelligensie-navorsers as 'n KI-agent beskryf word.[1] Dit dryf GitHub Copilot aan, 'n KI-gebaseerde kode-outovoltooiingsinstrument wat beskikbaar is in geselekteerde IDE's soos Visual Studio Code en Neovim[2]. Codex is 'n afstammeling van OpenAI se GPT-3-model, spesifiek geoptimaliseer vir programmeringstake.

Op 16 Mei 2025 het OpenAI die bekendstelling van 'n navorsingsvoorskou van Codex aangekondig.[3]

Vermoëns

[wysig | wysig bron]

Gebaseer op GPT-3, 'n neurale netwerk wat op teks opgelei is, is Codex addisioneel opgelei op 159 gigagrepe Python-kode van 54 miljoen GitHub-bewaarplekke.[4][5] 'n Tipiese gebruiksgeval van Codex is dat 'n gebruiker 'n opmerking tik, soos "//compute the moving average of an array for a given window size",, en dan die KI gebruik om 'n blok kode voor te stel wat aan daardie opmerkingsprompt voldoen.[6] OpenAI het verklaar dat Codex ongeveer 37% van versoeke kan voltooi en bedoel is om menslike programmering vinniger te maak eerder as om dit te vervang. Volgens OpenAI se blog blink Codex die meeste uit in "die kartering van... eenvoudige probleme na bestaande kode", wat hulle beskryf as "waarskynlik die minste prettige deel van programmering".[7][8] Jeremy Howard, medestigter van Fast.ai, het verklaar dat "Codex 'n manier is om kode geskryf te kry sonder om soveel kode te skryf", en dat "dit nie altyd korrek is nie, maar dit is net naby genoeg".[9] Volgens 'n artikel wat deur OpenAI-navorsers geskryf is, het Codex, toe hulle elke toetsgeval 100 keer probeer het, werkende oplossings vir 70.2% van die aanwysings gegenereer.[10]

OpenAI beweer dat Codex kode in meer as 'n dosyn programmeertale kan skep, insluitend Go, JavaScript, Perl, PHP, Ruby, Shell, Swift en TypeScript, hoewel dit die doeltreffendste in Python is.[2]

Volgens VentureBeat het demonstrasies wat deur OpenAI opgelaai is, indrukwekkende ko-verwysingsresolusievermoëns getoon. Die demonstrateurs kon 'n blaaierspeletjie in JavaScript skep en datawetenskapkaarte genereer met behulp van matplotlib.[8]

OpenAI het getoon dat Codex kan koppel met dienste en toepassings soos Mailchimp, Microsoft Word, Spotify en Google Calendar.[8][11]

Die Codex-1-model is opgelei om versoeke vir wanware, uitbuiting of beleidskendende inhoud op te spoor en gee 'n weiering terug met 'n aangehaalde beleidsklousule. Die houer het ook geen uitgaande internet nie en slegs afhanklikhede op die witlys, wat die ontploffingsradius van enige slegte kode verminder.[12]

Probleme

[wysig | wysig bron]

OpenAI-demonstrasies het foute soos ondoeltreffende kode en eenmalige eienaardighede in kodevoorbeelde getoon.[8] In 'n onderhoud met The Verge het OpenAI se hooftegnologiebeampte, Greg Brockman, gesê dat "soms [Codex] nie heeltemal presies weet wat jy vra nie" en dat dit 'n bietjie probeerslae kan vereis.[11] OpenAI-navorsers het bevind dat Codex sukkel met veelstap-aanwysings, dikwels misluk of teenintuïtiewe gedrag toon. Daarbenewens het hulle verskeie veiligheidskwessies geopper, soos oormatige afhanklikheid deur beginnerprogrammeerders, vooroordele gebaseer op die opleidingsdata en sekuriteitsimpakte as gevolg van kwesbare kode.[10]

VentureBeat het verklaar dat omdat Codex op openbare data opgelei is, dit kwesbaar kan wees vir "datavergiftiging" deur opsetlike oplaaie van kwaadwillige kode.[8] Volgens 'n studie deur navorsers van die Universiteit van New York, het ongeveer 40% van die kode wat deur GitHub Copilot (wat Codex gebruik) gegenereer is in scenario's wat relevant is vir hoërisiko-CWE's, foute of ander ontginbare ontwerpfoute ingesluit.[13]

Kopiereg

[wysig | wysig bron]

Die Free Software Foundation het kommer uitgespreek dat kodebrokkies wat deur Copilot en Codex gegenereer word, kopiereg kan skend, veral die voorwaarde van die GPL wat vereis dat afgeleide werke onder ekwivalente voorwaardes gelisensieer word.[14] Kwessies wat hulle geopper het, sluit in of opleiding op openbare bewaarplekke onder billike gebruik val of nie, hoe ontwikkelaars oortredende gegenereerde kode kan ontdek, of opgeleide masjienleermodelle as wysigbare bronkode of 'n samestelling van die opleidingsdata beskou kan word, en of masjienleermodelle self kopieregbeskerm kan word en deur wie.[14][15] 'n Interne GitHub-studie het bevind dat ongeveer 0.1% van die gegenereerde kode direkte kopieë van die opleidingsdata bevat het. In een voorbeeld het die model die opleidingsdatakode uitgevoer wat die vinnige inverse vierkantswortelalgoritme implementeer, insluitend kommentaar en 'n verkeerde kopieregkennisgewing.[6]

In reaksie hierop het OpenAI verklaar dat "regsonsekerheid oor die kopieregimplikasies van die opleiding van KI-stelsels aansienlike koste vir KI-ontwikkelaars inhou en dus gesaghebbend opgelos moet word."[6]

Die kopieregkwessies met Codex is vergelyk met die Authors Guild, Inc. teen Google Inc.-hofsaak, waarin regters beslis het dat Google Books se gebruik van teksbrokkies uit miljoene geskandeerde boeke billike gebruik uitmaak.[6][16] Die gebruik van teksbrokkies uit boeke bied egter 'n betroubare verwysing na die kopiereghouer, in teenstelling met saamgestelde werke wat vir die opleidingsalgoritmedata gebruik word waar die finale uitvoer sonder enige sodanige verwysing gemaak word.

Verwysings

[wysig | wysig bron]
  1. Metz, Cade (16 Mei 2025). "OpenAI Unveils New Tool for Computer Programmers". The New York Times (in Engels). Besoek op 20 Mei 2025.
  2. 2,0 2,1 Zaremba, Wojciech (10 Augustus 2021). "OpenAI Codex". OpenAI. Geargiveer vanaf die oorspronklike op 3 Februarie 2023. Besoek op 3 September 2021.
  3. Knight, Will (16 Mei 2025). "OpenAI Launches an Agentic, Web-Based Coding Tool". Wired (in Engels). Besoek op 20 Mei 2025.
  4. Wiggers, Kyle (8 Julie 2021). "OpenAI warns AI behind GitHub's Copilot may be susceptible to bias". VentureBeat. Geargiveer vanaf die oorspronklike op 3 Februarie 2023. Besoek op 3 September 2021.
  5. Alford, Anthony (31 Augustus 2021). "OpenAI Announces 12 Billion Parameter Code-Generation AI Codex". InfoQ. Geargiveer vanaf die oorspronklike op 9 Julie 2022. Besoek op 3 September 2021.
  6. 6,0 6,1 6,2 6,3 Anderson, Tim; Quach, Katyanna (6 Julie 2021). "GitHub Copilot auto-coder snags emerge, from seemingly spilled secrets to bad code, but some love it". The Register. Geargiveer vanaf die oorspronklike op 2 Junie 2023. Besoek op 4 September 2021.
  7. Dorrier, Jason (15 Augustus 2021). "OpenAI's Codex Translates Everyday Language Into Computer Code". SingularityHub. Geargiveer vanaf die oorspronklike op 26 Mei 2023. Besoek op 3 September 2021.
  8. 8,0 8,1 8,2 8,3 8,4 Dickson, Ben (16 Augustus 2021). "What to expect from OpenAI's Codex API". VentureBeat. Geargiveer vanaf die oorspronklike op 3 Februarie 2023. Besoek op 3 September 2021.
  9. Metz, Cade (9 September 2021). "A.I. Can Now Write Its Own Computer Code. That's Good News for Humans". The New York Times. Geargiveer vanaf die oorspronklike op 30 Maart 2022. Besoek op 16 September 2021.
  10. 10,0 10,1 Chen, Mark; Tworek, Jerry; Jun, Heewoo; Yuan, Qiming; Pinto, Henrique Ponde de Oliveira; Kaplan, Jared; Edwards, Harri; Burda, Yuri et al. (2021-07-14). "Evaluating Large Language Models Trained on Code". [cs]. 
  11. 11,0 11,1 Vincent, James (10 Augustus 2021). "OpenAI can translate English into code with its new machine learning software Codex". The Verge. Geargiveer vanaf die oorspronklike op 2 September 2021. Besoek op 3 September 2021.
  12. Nuzhnyy, Sergey (19 Mei 2025). "What is Codex? Exploring OpenAI's AI Coding Agentx". ML API.
  13. Pearce, Hammond; Ahmad, Baleegh; Tan, Benjamin; Dolan-Gavitt, Brendan; Karri, Ramesh (2021-12-16). "Asleep at the Keyboard? Assessing the Security of GitHub Copilot's Code Contributions". [cs.CR]. 
  14. 14,0 14,1 Krill, Paul (2 Augustus 2021). "GitHub Copilot is 'unacceptable and unjust,' says Free Software Foundation". InfoWorld. Geargiveer vanaf die oorspronklike op 3 September 2021. Besoek op 3 September 2021.
  15. Robertson, Donald (28 Julie 2021). "FSF-funded call for white papers on philosophical and legal questions around Copilot: Submit before Monday, 23 Augustus 2021". Free Software Foundation. Geargiveer vanaf die oorspronklike op 11 Augustus 2021. Besoek op 4 September 2021.
  16. Barber, Gregory (12 Julie 2021). "GitHub's Commercial AI Tool Was Built From Open Source Code". WIRED. Geargiveer vanaf die oorspronklike op 25 Julie 2021. Besoek op 4 September 2021.