Cyc
Versiunea actuală a paginii nu a fost încă revizuită de colaboratori experimentați și poate diferi semnificativ de
versiunea revizuită pe 26 august 2018; verificările necesită
12 modificări .
Cyc ( scris în latină, pronunțat Cyc ) este un proiect de creare a unei baze de cunoștințe ontologice voluminoase care permite programelor să rezolve probleme complexe din domeniul inteligenței artificiale pe baza inferenței logice și a folosirii bunului simț .
Prezentare generală
Proiectul a fost început de Douglas Lenat în 1984 la Microelectronics and Computer Technology Corporation . Numele „Cyc” (derivat din enciclopedia engleză : „cyc”) este o marcă înregistrată a Cycorp, Inc din Austin , operată de Lenat și creată pentru a dezvolta Cyc. Baza de cunoștințe este proprietatea companiei, dar o mică parte a bazei, menită să stabilească un vocabular comun pentru programele de raționament automat, a fost lansată ca OpenCyc sub o licență deschisă . Ulterior, Cyc a fost pus la dispoziția cercetătorilor AI sub o licență specială de cercetare de la ResearchCyc .
Exemple tipice de cunoștințe din baza de date sunt: „Fiecare copac este o plantă” și „Plantele sunt muritoare”. Dacă întrebați „mor copacii?”, motorul de inferență poate trage concluzia evidentă și poate da răspunsul corect. Baza de cunoștințe (Baza de cunoștințe în engleză sau KB) conține mai mult de un milion de declarații, reguli și idei frecvent utilizate introduse acolo de oameni. Ele sunt formulate în limbajul CycL , care se bazează pe calculul predicatului și are o sintaxă asemănătoare Lisp . Utilizatorii vorbitori de limba engleză glumesc că sunt „bicicliști” (de la biciclistul englez - un biciclist).
Cea mai mare parte a muncii de astăzi în proiectul Cyc este încă despre ingineria cunoașterii - descriind manual fapte despre lumea din jurul nostru și implementând mecanisme eficiente de inferență bazate pe aceste cunoștințe. Cu toate acestea, se lucrează pentru a permite sistemului Cyc să comunice independent cu utilizatorii în limbaj natural și pentru a accelera procesul de completare a bazei folosind învățarea automată .
Descrierea bazei de cunoștințe, terminologie
Conceptele din Cyc sunt numite constante . Numele constantelor încep cu caracterele opționale „#$” și sunt sensibile la majuscule și minuscule. Există constante pentru:
- elemente individuale numite individual , cum ar fi #$BillClinton sau #$France.
- colecții ( Colecții ) precum #$Tree-ThePlant (care conține toți copacii) sau #$EquivalenceRelation (care conține toate relațiile de echivalență ). Un membru al unei colecții se numește o instanță a acelei colecții.
- Truth Funcții care pot fi aplicate unuia sau mai multor concepte și returnează adevărat sau fals . De exemplu, #$frați este o relație de frați care este adevărată numai dacă două dintre argumentele sale sunt frați. Prin convenție, constantele funcției de adevăr încep cu o literă mică. Funcțiile de adevăr pot fi împărțite în conexiuni logice (cum ar fi #$și, #$sau, #$nu, #$implică), cuantificatori (#$forAll, #$există etc.) și predicate .
- Funcții , care formează termeni noi din date. De exemplu, dacă treceți un tip (sau o colecție) de plante ca argument funcției #$FruitFn, aceasta va returna o colecție a fructelor acestora. Prin convenție, numele constantelor de funcție încep cu o literă mare și se termină cu șirul „Fn”.
Cele mai importante predicate sunt #$isa și #$genls. Prima este o declarație conform căreia un element este o instanță a unei colecții, iar a doua este că o colecție este o subcolecție a unei alte colecții. Faptele despre concepte sunt declarate folosind instrucțiuni speciale CyclL . Predicatele sunt scrise între paranteze înaintea argumentelor lor:
(#$isa #$BillClinton #$Președintele Statelor Unite)
înseamnă că „Bill Clinton este unul dintre președinții Statelor Unite”, și declarația
(#$genls #$Tree-ThePlant #$Plant)
scrie „Toți copacii sunt plante”.
(#$capitalCity #$Franța #$Paris)
înseamnă „Paris este capitala Franței”.
De asemenea, instrucțiunile pot conține variabile, linii care încep cu „?”. Aceste afirmații se numesc „reguli”. Una dintre cele mai importante reguli referitoare la predicatul #$isa este:
(#$implică
(#$și
(#$isa ?OBJ ?SUBSET)
(#$genls ?SUBSET ?SUPERSET))
(#$isa ?OBJ ?SUPERSET))
ceea ce înseamnă „dacă OBJ este o instanță a colecției SUBSET și SUBSET la rândul său este o subcolecție a SUPERSET, atunci OBJ este, de asemenea, o instanță a colecției SUPERSET”. Un alt exemplu tipic:
(#$relationAllExists #$biologicalMother #$ChordataPhylum #$FemaleAnimal)
ceea ce înseamnă că orice instanță a colecției #$ChordataPhylum (adică orice cordat ) este asociată cu un animal femelă (o instanță de #$FemaleAnimal) care este mama sa (așa cum este descris de predicatul #$BiologicalMother).
Baza de cunoștințe Cyc este împărțită în microteorii (Mt), culegeri de concepte și fapte aparținând unui anumit domeniu de cunoaștere. Spre deosebire de o bază completă de cunoștințe, orice microteorie trebuie să fie lipsită de contradicții. Fiecare microteorie are un nume care este o constantă obișnuită; prin convenție, constantele microteoriei conțin șirul „Mt”. Un exemplu este #$MathMt, o microteorie care conține cunoștințe matematice. Microteoriile pot fi moștenite una de la alta și sunt organizate într-o ierarhie: una dintre specializările #$MathMt este #$GeometryGMt - o microteorie despre geometrie.
opencyc
Cea mai recentă versiune a OpenCyc, 1.0, a fost lansată în iulie 2006. OpenCyc 1.0 include o ontologie Cyc completă care conține sute de mii de expresii, milioane de declarații care leagă termeni între ei. Baza de cunoștințe conține 47.000 de concepte și 306.000 de fapte și poate fi vizualizată pe site-ul OpenCyc. Prima versiune a OpenCyc a fost lansată în mai 2001, cu doar 6.000 de concepte și 60.000 de fapte. Baza de cunoștințe este lansată sub licența Apache . Cycorp intenționează să lanseze OpenCyc sub licențe paralele, mai puțin restrictive, pentru a satisface nevoile utilizatorilor săi. Interpretul CycL și SubL (un program care vă permite să vizualizați și să modificați baza de date și să trageți concluzii) este lansat gratuit, dar numai în formă binară, fără cod sursă. Funcționează atât sub GNU/Linux , cât și sub Microsoft Windows .
ResearchCyc
În iulie 2006, Cycorp a lansat ResearchCyc 1.0, o versiune gratuită (dar cu sursă închisă) a Cyc destinată comunității de cercetare. (ResearchCyc a fost în versiune beta pe tot parcursul anului 2004 și a fost lansat în testare beta în februarie 2005.) Pe lângă informațiile taxonomice de la OpenCyc, ResearchCyc include mult mai multe cunoștințe semantice (adică fapte suplimentare) despre conceptele din baza sa de cunoștințe și include un lexicon mare, instrumente pentru analizarea și generarea limbii engleze , scrise în interfețe Java pentru editarea cunoștințelor și crearea de interogări la baza de date.
Cycorp și-a exprimat public intenția de a elibera toți termenii și relațiile taxonomice conținute în ResearchCyc ca parte a OpenCyc, iar acest lucru a fost făcut în versiunea 1.0. Unul dintre scopurile declarate este acela de a crea un vocabular semantic complet gratuit și nerestricționat pentru a fi utilizat pe Web-ul semantic . Taxonomia OpenCyc este disponibilă în format Owl de pe site-ul web al proiectului OpenCyc.
Critica proiectului Cyc
Cyc a fost descris ca fiind „una dintre cele mai controversate eforturi din istoria inteligenței artificiale” (Bertino et al. p. 275), așa că a primit inevitabil partea echitabilă de critici.
- Complexitatea excesivă a sistemului - fără îndoială necesară din cauza ambițiilor enciclopedice - și, în consecință, complexitatea adăugării (manuale) a datelor în sistem;
- Probleme de scalabilitate din reificarea pe scară largă, în special ca constante;
- Utilizarea nesatisfăcătoare a conceptului de materie și distincția aferentă între proprietăți intrinseci și extrinseci;
- Lipsa măsurătorilor de performanță sau a comparațiilor corecte ale eficienței motorului de inferență Cyc;
- Incompletitudinea actuală a sistemului atât în lățime, cât și în profunzime, și dificultatea asociată în măsurarea completității acestuia;
- Lipsa documentatiei;
- Lipsa unui material de instruire online actualizat face dificilă învățarea sistemului pentru noii veniți;
- În ciuda numelui său, sistemul OpenCyc nu este complet deschis: datele sunt editabile de utilizatori, dar codul nu este extensibil de către dezvoltatori. [unu]
Aceste probleme au fost discutate în diferite locuri de la lansarea proiectului. Doug Lenat și alții au publicat multe argumente în apărarea proiectului lor.
Vezi și
Bibliografie
- Elisa Bertino, Gian Piero Zarri, Barbara Catania, Gian Pierro Zarri. Sisteme inteligente de baze de date (neopr.) . - Addison-Wesley Professional , 2001.
- Matuszek, Cynthia, M. Witbrock , R. Kahlert, J. Cabral, D. Schneider, P. Shah și D. Lenat . În căutarea bunului simț: popularea Cyc de pe web . În Proceedings of the Twentieth National Conference on Artificial Intelligence, Pittsburgh, Pennsylvania, iulie 2005. [1]
- Shepard, Blake, C. Matuszek, C. B. Fraser, W. Wechtenhiser, D. Crabbe, Z. Gungordu, J. Jantos, T. Hughes, L. Lefkowitz, M. Witbrock, D. Lenat, E. Larson. O abordare bazată pe cunoștințe a securității rețelei: aplicarea Cyc în domeniul evaluării riscurilor de rețea . În Proceedings of the Seventeenth Innovative Applications of Artificial Intelligence Conference, Pittsburgh, Pennsylvania, iulie 2005. [2]
- Ramachandran, Deepak, P. Reagan, K. Goolsbey. Cercetare de prim ordin: expresivitate și eficiență într-o ontologie de bun simț . În Lucrări de la Atelierul AAAI privind Contexte și Ontologii: Teorie, Practică și Aplicații. Pittsburgh, Pennsylvania, iulie 2005. [3]
- Cabral, John, R. C. Kahlert, C. Matuszek, M. Witbrock, B. Summers. Conversia meta-cunoștințelor semantice în prejudecăți inductive . În Proceedings of the 15th International Conference on Inductive Logic Programming, Bonn, Germania, august 2005. [4]
- Schneider, Dave, C. Matuszek, P. Shah, R. Kahlert, D. Baxter, J. Cabral, M. Witbrock, D. Lenat. Colectarea și gestionarea faptelor pentru analiza de informații . În Proceedings of the 2005 International Conference on Intelligence Analysis, McLean, Virginia, mai 2005. [5]
- Forbus, Kenneth, L. Birnbaum, E. Wagner, J. Baker și M. Witbrock . Combinând analogia, regăsirea inteligentă a informațiilor și integrarea cunoștințelor pentru analiză: un raport preliminar . În Proceedings of the 2005 International Conference on Intelligence Analysis, McLean, Virginia, mai 2005. [6]
- Deaton, Chris, B. Shepard, C. Klein, C. Mayans, B. Summers, A. Brusseau, M. Witbrock . Baza cuprinzătoare de cunoștințe privind terorismul din Cyc. În Proceedings of the 2005 International Conference on Intelligence Analysis, McLean, Virginia, mai 2005. [7]
- Rode, Benjamin. Către un model de recuperare a modelelor în datele relaționale . În Proceedings of the 2005 International Conference on Intelligence Analysis, McLean, Virginia, mai 2005. [8]
- Siegel, Nick, B. Shepard, J. Cabral, M. Witbrock. Generarea de ipoteze și ansamblu de dovezi pentru analiza de informații: aplicația Cycorp Nooscape . În Proceedings of the 2005 International Conference on Intelligence Analysis, McLean, Virginia, mai 2005. [9]
- Curtis, Jon, G. Matthews, D. Baxter. Despre utilizarea eficientă a Cyc într-un sistem de răspuns la întrebări în documentele de la Atelierul IJCAI privind cunoștințele și raționarea răspunsurilor la întrebări, Edinburgh, Scoția: 2005. [10]
- Witbrock, Michael, C. Matuszek, A. Brusseau, R. C. Kahlert, C. B. Fraser, D. Lenat. Knowledge Begets Knowledge: Steps to assistant Knowledge Acquisition in Cyc in Papers from the 2005 AAAI Spring Symposium on Knowledge Collection from Volunteer Contributors (KCVC), pp. 99–105. Stanford, California, martie 2005. [11]
- Belasco, Alan, J. Curtis, R. C. Kahlert, C. Klein, C. Mayans, R. Reagan. Reprezentarea eficientă a lacunelor de cunoștințe . În D. Karagiannis, U. Reimer (Eds.): Practical Aspects of Knowledge Management, Proceedings of PAKM 2004, Viena, Austria, 2-3 decembrie 2004, Springer-Verlag, Berlin Heidelberg. [12]
- Siegel, Nick, G. Matthews, J. Masters, R. Kahlert, M. Witbrock și K. Pittman. Arhitecturi de agent: combinarea punctelor forte ale ingineriei software și ale sistemelor cognitive în lucrări de la Workshop-ul AAAI privind arhitecturile de agenți inteligenți: combinarea punctelor forte ale ingineriei software și ale sistemelor cognitive, Raport tehnic WS-04-07, pp. 74–79. Menlo Park, California: AAAI Press, 2004. [13]
- Witbrock, Michael, K. Panton, S. L. Reed, D. Schneider, B. Aldag, M. Reimers și S. Bertolo. Adnotare automată OWL asistată de o bază mare de cunoștințe în notele atelierului de lucru din 2004 privind marcarea cunoștințelor și adnotarea semantică la cea de-a 3-a conferință internațională web semantic ISWC2004, Hiroshima, Japonia, noiembrie 2004, pp. 71–80. [paisprezece]
- Masters, James și Z. Gungordu. Integrarea sursei de cunoștințe structurate: un raport de progres . În Integration of Knowledge Intensive Multiagent Systems, Cambridge, Massachusetts, SUA, 2003. [15]
- O'Hara, Tom, N. Salay, M. Witbrock, et al. Inducerea criteriilor pentru mapările lexicale de nume de masă folosind baza de cunoștințe Cyc și extensia acesteia la WordNet . În Proceedings of the Fifth International Workshop on Computational Semantics, Tilburg, 2003. [16]
- Witbrock, Michael, D. Baxter, J. Curtis, et al. Un sistem de dialog interactiv pentru achiziția de cunoștințe în Cyc . În Proceedings of the Eighteenth International Joint Conference on Artificial Intelligence, Acapulco, Mexic, 2003. [17]
- Panton, Kathy, P. Miraglia, N. Salay, et al. Formarea cunoștințelor și dialogul folosind setul de instrumente KRAKEN . În a optsprezecea Conferință Națională privind Inteligența Artificială, Edmonton, Canada, 2002. [18]
- Maeștri, James. Integrarea surselor de cunoștințe structurate și aplicațiile acesteia la fuziunea informațiilor . În Proceedings of the Fifth International Conference on Information Fusion, Annapolis, MD, iulie 2002. [19]
- Reed, Stephen și D. Lenat. Maparea ontologiilor în Cyc . În AAAI 2002 Conference Workshop on Ontologis For The Semantic Web, Edmonton, Canada, iulie 2002. [20]
- D. Lenat şi R. V. Guha. Construirea de sisteme mari bazate pe cunoștințe: reprezentare și inferență în proiectul Cyc . - Addison-Wesley , 1990.
- Mașina de gândire fictivă SAL 9000 se referă în mod explicit la o bază de date enciclopedică pentru a înțelege de ce creatorul său a folosit numele „Phoenix” pentru o simulare de diagnosticare care ar ajuta la repornirea dispozitivului său geamăn, HAL 9000 , în saga din 2001 .
- Mașina de gândire fictivă KARR (Knight Rider) accesează în mod explicit o bază de date în timpul unui test al dorințelor umane de bază (episodul „Trust doesn’t rugin”).
Note
- ↑ Volkel M., Krotzsch M., Vrandecic D., Haller H., Studer R. Semantic Wikipedia Arhivat la 31 decembrie 2019 la Wayback Machine . În Proceedings of the 15th International Conference on the World Wide Web. WWW '06. ACM Press, New York, NY. Edinburgh, Scoția, 23-26 mai 2006. - pp. 585-594
Link -uri
Dicționare și enciclopedii |
|
---|