Model fundamentalny

Model fundamentalny, model podstawowy^[1] (ang. foundation model, FM) – model uczenia maszynowego lub głębokiego uczenia, który jest trenowany na dużych zbiorach danych, tak aby można go było stosować w szerokim zakresie przypadków użycia^[2]^[3]. Przykładami modeli fundamentalnych są duże modele językowe^[4].

Budowa modeli fundamentowych wymaga drogich zasobów, a najbardziej zaawansowane modele kosztują setki milionów dolarów, co wiąże się z koniecznością pokrycia wydatków na pozyskiwanie, gromadzenie i przetwarzanie dużych zbiorów danych, a także mocy obliczeniowej niezbędnej do szkoleń. Adaptacja modelu fundamentalnego na własny użytek zmniejsza koszt wdrożenia modelu w danym przypadku użycia^[3].

Wczesnymi przykładami modeli podstawowych są modele językowe takie jak seria GPT od OpenAI i BERT od Google^[5]^[6]. Oprócz tekstów, opracowano modele fundamentalne do różnych zastosowań:

Dla obrazów: DALL-E i Flamingo^[7]
Do muzyki: MusicGen^[8]
Sterowanie robotami: RT-2^[9]

Opracowywane są również modele fundamentalne dla takich dziedzin jak astronomia^[10], radiologia^[11], genetyka^[12], muzyka^[13], programowanie, prognozowanie szeregów czasowych^[14], matematyka^[15] i chemia^[16].

Adaptacja

Modele podstawowe są z natury ogólnego zastosowania. Aby użyć ich w konkretnym przypadku, konieczna jest ich adaptacja. Modele muszą zostać dostosowane do wykonywania ich zadania, dzięki czemu mogą osiągnąć lepszą wydajność w danej specjalizacji^[17].

Różne metody jak inżynieria podpowiedzi czy dostrajanie pozwalają na specjalizację modelu fundamentalnego mniejszym lub większym kosztem. Inżynierowie mogą też zmodyfikować samą sieć i zmniejszyć ilość parametrów z bilionów do ułamka tej wartości przez używanie ostatniej warstwy sieci neuronowej^[18].

Przypisy

↑ WłodzimierzW. Szpringer WłodzimierzW., Modele podstawowe AI – nowe dylematy platformizacji w gospodarce cyfrowej, „Kwartalnik Nauk o Przedsiębiorstwie”, 75 (1), 2025, s. 5–22, DOI: 10.33119/KNOP.2025.75.1.1, ISSN 2719-3276 [dostęp 2025-04-15] .
↑ LidiaL. Krawczyk LidiaL., Maszynowe projektowanie statystycznych renderingów, czyli kultura wizualna w służbie sztucznej inteligencji, „AUPC Studia ad Bibliothecarum Scientiam Pertinentia”, 22, 2024, s. 532–560, DOI: 10.24917/20811861.22.31, ISSN 2300-3057 [dostęp 2025-04-15] (pol.).
↑ ^a ^b RishiR. Bommasani RishiR. i inni, On the Opportunities and Risks of Foundation Models, „arXiv”, 2022, DOI: 10.48550/arXiv.2108.07258, arXiv:2108.07258 [dostęp 2025-04-15] .
↑ Competition and MarketsC.M. Authority Competition and MarketsC.M., AI Foundation Models: Initial Report [online], 2023 .
↑ MohammedM. Haddad MohammedM., How does GPT-4 work and how can you start using it in ChatGPT? [online], Al Jazeera [dostęp 2025-04-15] (ang.).
↑ AnnaA. Rogers AnnaA., OlgaO. Kovaleva OlgaO., AnnaA. Rumshisky AnnaA., A Primer in BERTology: What we know about how BERT works, „arXiv”, 2020, DOI: 10.48550/arXiv.2002.12327, arXiv:2002.12327 [dostęp 2025-04-15] .
↑ Tackling multiple tasks with a single visual language model [online], Google DeepMind, 2 kwietnia 2025 [dostęp 2025-04-15] (ang.).
↑ JadeJ. Copet JadeJ. i inni, Simple and Controllable Music Generation, „arXiv”, 2024, DOI: 10.48550/arXiv.2306.05284, arXiv:2306.05284 [dostęp 2025-04-15] .
↑ Speaking robot: Our new AI model translates vision and language into robotic actions [online], Google, 28 lipca 2023 [dostęp 2025-04-15] (ang.).
↑ Tuan DungT.D. Nguyen Tuan DungT.D. i inni, AstroLLaMA: Towards Specialized Foundation Models in Astronomy, „arXiv”, 2023, DOI: 10.48550/arXiv.2309.06126, arXiv:2309.06126 [dostęp 2025-04-15] .
↑ TaoT. Tu TaoT. i inni, Towards Generalist Biomedical AI, „arXiv”, 2023, DOI: 10.48550/arXiv.2307.14334, arXiv:2307.14334 [dostęp 2025-04-15] .
↑ MaximM. Zvyagin MaximM. i inni, GenSLMs: Genome-scale language models reveal SARS-CoV-2 evolutionary dynamics, bioRxiv, 23 listopada 2022, DOI: 10.1101/2022.10.10.511571 [dostęp 2025-04-15] (ang.).
↑ SpotifyS. Engineering SpotifyS., LLark: A Multimodal Foundation Model for Music [online], Spotify Research, 13 października 2023 [dostęp 2025-04-15] (ang.).
↑ 🔳 Turing🔳 T. Post 🔳 Turing🔳 T., Revolutionizing Time Series Forecasting: Interview with TimeGPT's creators [online], Turing Post [dostęp 2025-04-15] (ang.).
↑ ZhangirZ. Azerbayev ZhangirZ. i inni, Llemma: An Open Language Model For Mathematics, „arXiv”, 2024, DOI: 10.48550/arXiv.2310.10631, arXiv:2310.10631 [dostęp 2025-04-15] .
↑ Orbital [online], www.orbitalmaterials.com [dostęp 2025-04-15] .
↑ JohannesJ. Schneider JohannesJ., Foundation models in brief: A historical, socio-technical focus, „arXiv”, 2022, DOI: 10.48550/arXiv.2212.08967, arXiv:2212.08967 [dostęp 2025-04-15] .
↑ Elad BenE.B. Zaken Elad BenE.B., ShauliS. Ravfogel ShauliS., YoavY. Goldberg YoavY., BitFit: Simple Parameter-efficient Fine-tuning for Transformer-based Masked Language-models, „arXiv”, 2022, DOI: 10.48550/arXiv.2106.10199, arXiv:2106.10199 [dostęp 2025-04-15] .

[1] WłodzimierzW. Szpringer WłodzimierzW., Modele podstawowe AI – nowe dylematy platformizacji w gospodarce cyfrowej, „Kwartalnik Nauk o Przedsiębiorstwie”, 75 (1), 2025, s. 5–22, DOI: 10.33119/KNOP.2025.75.1.1, ISSN 2719-3276 [dostęp 2025-04-15] .

[2] LidiaL. Krawczyk LidiaL., Maszynowe projektowanie statystycznych renderingów, czyli kultura wizualna w służbie sztucznej inteligencji, „AUPC Studia ad Bibliothecarum Scientiam Pertinentia”, 22, 2024, s. 532–560, DOI: 10.24917/20811861.22.31, ISSN 2300-3057 [dostęp 2025-04-15] (pol.).

[:0-3] RishiR. Bommasani RishiR. i inni, On the Opportunities and Risks of Foundation Models, „arXiv”, 2022, DOI: 10.48550/arXiv.2108.07258, arXiv:2108.07258 [dostęp 2025-04-15] .

[4] Competition and MarketsC.M. Authority Competition and MarketsC.M., AI Foundation Models: Initial Report [online], 2023 .

[5] MohammedM. Haddad MohammedM., How does GPT-4 work and how can you start using it in ChatGPT? [online], Al Jazeera [dostęp 2025-04-15] (ang.).

[6] AnnaA. Rogers AnnaA., OlgaO. Kovaleva OlgaO., AnnaA. Rumshisky AnnaA., A Primer in BERTology: What we know about how BERT works, „arXiv”, 2020, DOI: 10.48550/arXiv.2002.12327, arXiv:2002.12327 [dostęp 2025-04-15] .

[7] Tackling multiple tasks with a single visual language model [online], Google DeepMind, 2 kwietnia 2025 [dostęp 2025-04-15] (ang.).

[8] JadeJ. Copet JadeJ. i inni, Simple and Controllable Music Generation, „arXiv”, 2024, DOI: 10.48550/arXiv.2306.05284, arXiv:2306.05284 [dostęp 2025-04-15] .

[9] Speaking robot: Our new AI model translates vision and language into robotic actions [online], Google, 28 lipca 2023 [dostęp 2025-04-15] (ang.).

[10] Tuan DungT.D. Nguyen Tuan DungT.D. i inni, AstroLLaMA: Towards Specialized Foundation Models in Astronomy, „arXiv”, 2023, DOI: 10.48550/arXiv.2309.06126, arXiv:2309.06126 [dostęp 2025-04-15] .

[11] TaoT. Tu TaoT. i inni, Towards Generalist Biomedical AI, „arXiv”, 2023, DOI: 10.48550/arXiv.2307.14334, arXiv:2307.14334 [dostęp 2025-04-15] .

[12] MaximM. Zvyagin MaximM. i inni, GenSLMs: Genome-scale language models reveal SARS-CoV-2 evolutionary dynamics, bioRxiv, 23 listopada 2022, DOI: 10.1101/2022.10.10.511571 [dostęp 2025-04-15] (ang.).

[13] SpotifyS. Engineering SpotifyS., LLark: A Multimodal Foundation Model for Music [online], Spotify Research, 13 października 2023 [dostęp 2025-04-15] (ang.).

[14] 🔳 Turing🔳 T. Post 🔳 Turing🔳 T., Revolutionizing Time Series Forecasting: Interview with TimeGPT's creators [online], Turing Post [dostęp 2025-04-15] (ang.).

[15] ZhangirZ. Azerbayev ZhangirZ. i inni, Llemma: An Open Language Model For Mathematics, „arXiv”, 2024, DOI: 10.48550/arXiv.2310.10631, arXiv:2310.10631 [dostęp 2025-04-15] .

[16] Orbital [online], www.orbitalmaterials.com [dostęp 2025-04-15] .

[17] JohannesJ. Schneider JohannesJ., Foundation models in brief: A historical, socio-technical focus, „arXiv”, 2022, DOI: 10.48550/arXiv.2212.08967, arXiv:2212.08967 [dostęp 2025-04-15] .

[18] Elad BenE.B. Zaken Elad BenE.B., ShauliS. Ravfogel ShauliS., YoavY. Goldberg YoavY., BitFit: Simple Parameter-efficient Fine-tuning for Transformer-based Masked Language-models, „arXiv”, 2022, DOI: 10.48550/arXiv.2106.10199, arXiv:2106.10199 [dostęp 2025-04-15] .

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]