(SeaPRwire) – LOS ANGELES, 02. April 2026 — Fotor, das von Everimaging entwickelte KI-Flaggschiffprodukt, gab heute bekannt, dass sein neuestes gemeinsames Forschungsergebnis als Konferenzbeitrag für die ICLR 2026 angenommen wurde, eine der weltweit führenden akademischen Konferenzen im Bereich der künstlichen Intelligenz.

Der Beitrag mit dem Titel „WEB-COGREASONER: TOWARDS MULTIMODAL KNOWLEDGE-INDUCED COGNITIVE REASONING FOR WEB AGENTS“ stellt einen bedeutenden Meilenstein im Zeitalter autonomer KI-Operationen dar. Dieser Durchbruch wurde durch eine gemeinsame Anstrengung von Fotor und renommierten Universitäten/Forschungseinrichtungen erzielt und überbrückt erfolgreich die Lücke zwischen akademischen Errungenschaften und industrieller Praxis.
Kern-Durchbruch: Der KI „Dreifaches Wissen“ beibringen
Angesichts komplexer Webseiten und Pop-up-Störungen geraten traditionelle Web-Agenten oft in Endlosschleifen. Um diesen Engpass zu überwinden, ließ sich das gemeinsame Forschungsteam von der „Bloom’s Taxonomy“ aus der pädagogischen Psychologie inspirieren und schlug innovativ das Web-CogKnowledge-Framework vor.
Dieses Framework zerlegt den KI-Lernprozess in drei fortschreitende kognitive Stufen:
- Faktisches Wissen: Ermöglicht es der KI, Webelemente präzise zu identifizieren und die direkten Konsequenzen einzelner Interaktionen vorherzusagen.
- Konzeptuelles Wissen: Verleiht der KI ein tiefes semantisches Verständnis, um Komponentenfunktionen abzuleiten und die Gesamtabsicht einer Webseite zu erfassen.
- Prozedurales Wissen: Trainiert die KI in Planung und Entscheidungsfindung, um Aktionssequenzen auszuführen und unerwartete Unterbrechungen wie Pop-ups zu bewältigen.
Gestützt von diesem System und dem Web-CogDataset (erstellt aus 14 realen Websites), verfügt die KI nun über einen leistungsstarken „Wissensgesteuerten Gedankenketten-Prozess (Chain of Thought, CoT)“ für tiefgreifendes logisches Denken.
Von der Forschung zum Produkt: Antrieb für die nächste Generation des Fotor Agent
Basierend auf seiner ICLR 2026-Forschung hat Fotor die Fähigkeit erlangt, akademische Durchbrüche in Produktqualität umzuwandeln, indem es diese Fortschritte mit führenden Open-Source-Agenten-Frameworks (z.B. OpenClaw) integriert. Damit rückt die nächste Entwicklungsstufe des Fotor Agent in greifbare Nähe.
Im Rahmen des Web-CogReasoner-Frameworks emanzipiert sich der Fotor Agent von der Abhängigkeit vom zugrundeliegenden Code einer Webseite (DOM-Baum). Durch die Nutzung von „reiner Pixel-Visualwahrnehmung“ und dem im gemeinsamen Beitrag vorgestellten plattformübergreifenden kognitiven Framework kann der Fotor Agent Arbeitsabläufe nahtlos über Webversionen, Desktop-Software und mobile Apps hinweg verwalten. Dies markiert einen entscheidenden Schritt in Richtung Universal Computer Control (UCC), was es Nutzern ermöglicht, komplexe Aufgaben durch einen einzigen Befehl zu erledigen.
Über Fotor
Fotor widmet sich der praktischen Anwendung erstklassiger KI-Forschung und überbrückt die Lücke zwischen komplexen neuronalen Architekturen und intuitiven Kreativwerkzeugen. Durch sein robustes globales Forschungsnetzwerk bringt Fotor weiterhin neue KI-Erlebnisse zu weltweit mehr als 800 Millionen Nutzern.
Pressekontakt:
CONTACT: Coran Huang
EMAIL: coran@fotor.com
WEB: www.fotor.com
Der Artikel wird von einem Drittanbieter bereitgestellt. SeaPRwire (https://www.seaprwire.com/) gibt diesbezüglich keine Zusicherungen oder Darstellungen ab.
Branchen: Top-Story, Tagesnachrichten
SeaPRwire liefert Echtzeit-Pressemitteilungsverteilung für Unternehmen und Institutionen und erreicht mehr als 6.500 Medienshops, 86.000 Redakteure und Journalisten sowie 3,5 Millionen professionelle Desktops in 90 Ländern. SeaPRwire unterstützt die Verteilung von Pressemitteilungen in Englisch, Koreanisch, Japanisch, Arabisch, Vereinfachtem Chinesisch, Traditionellem Chinesisch, Vietnamesisch, Thailändisch, Indonesisch, Malaiisch, Deutsch, Russisch, Französisch, Spanisch, Portugiesisch und anderen Sprachen.