Ambience Website Content Classifier (CAS)
Ambience Content Analysis System prowadzi analizę zawartości stron internetowych w czasie rzeczywistym (opóźnienia nie przekraczają 100ms). Moduł, wykorzystując protokoł ICAP, można zintegrować z serwerem proxy, a tym samym przekazywać z niego dane, które mają podlegać ocenie.
Moduł Ambience Website Content Classifier zintegrowano z funkcjonalnością filtrowania adresów URL serwera Passus Proxy. Treści strony internetowej przekazywane są za pomocą protokołu ICAP. Moduł analizuje zawartość strony, a następnie zwraca tym samym kanałem informacje o kategorii tematycznej danej strony oraz kontekście, w jakim występuje dany temat (np. treści mogą być dostępne dla wszystkich lub tylko określonej grupy np. dla dorosłych).
Do analizy zawartości strony przekazywane są jedynie elementy wybrane za pomocą reguł proxy. Selekcja odbywa się zarówno pod kątem typów obiektów, jak również typów oraz kategorii stron zgodnie z klasyfikacją dokonaną na podstawie adresu URL przez serwer proxy.
Analiza treści
System jest otwarty co oznacza, że użytkownik może dostosować mechanizm klasyfikacji na wiele sposobów:
- Poprzez definiowanie białej i czarnej listy.
- Poprzez sterowanie progiem odcięcia (czułością) modelu analitycznego
- Poprzez definiowanie nowych kategorii tematycznych lub modeli odpowiadających za kontekst treści.
Rozpoznawane kategorie stron
System jest wyposażony w gotowy do pracy silnik, który kategoryzuje strony w języku polskim i angielskim w kategoriach tematycznych przedstawionych w tabeli poniżej.
- ABORTION | - GAMES | - PLACEHOLDERS |