Pułapki w samplowaniu negatywnych zdarzeń

Rozwiązania
Ochrona zdrowia

Bezpieczeństwo pacjenta jest w naszych systemach priorytetowe. Cenimy sobie interpretowalność i rzetelność.

EMBRYOAID

Acorai

czytaj więcej

E-COMMERCE

Pozwól naszemu AI zdekodować potrzeby i zachowania Twoich odbiorców w sprzedaży i marketingu.

Showroom

Gemius

czytaj więcej

Bezpieczeństwo

Ataki cyfrowe są coraz bardziej skomplikowane. Zasil swoje narzędzia sztuczną inteligencją by spać spokojnie.

Policja

Smart Kid

czytaj więcej

Inne

Nie boimy się projektów nawet w najtrudniejszych sektorach – z sukcesem dostarczamy rozwiązania np. automotive.

GIVT

VOSS

czytaj więcej
Historie klientów
Wszystkie

Ochrona Zdrowia

E-Commerce

Bezpieczeństwo

Inne

Menu
Wydarzenia
Blog
O nas
O Nas

Nasz zespół

Dołącz do Nas

Prace badawcze

Projekty

Kontakt

Menu

Rozwiązania
Ochrona zdrowia

Bezpieczeństwo pacjenta jest w naszych systemach priorytetowe. Cenimy sobie interpretowalność i rzetelność.

EMBRYOAID

Acorai

czytaj więcej

E-COMMERCE

Pozwól naszemu AI zdekodować potrzeby i zachowania Twoich odbiorców w sprzedaży i marketingu.

Showroom

Gemius

czytaj więcej

Bezpieczeństwo

Ataki cyfrowe są coraz bardziej skomplikowane. Zasil swoje narzędzia sztuczną inteligencją by spać spokojnie.

Policja

Smart Kid

czytaj więcej

Inne

Nie boimy się projektów nawet w najtrudniejszych sektorach – z sukcesem dostarczamy rozwiązania np. automotive.

GIVT

VOSS

czytaj więcej
Historie klientów
Wszystkie

Ochrona Zdrowia

E-Commerce

Bezpieczeństwo

Inne

Menu
Wydarzenia
Blog
O nas
O Nas

Nasz zespół

Dołącz do Nas

Prace badawcze

Projekty

Kontakt

Menu

Blog

Opublikowano: 3 lata temu

Udostępnij:

Blog

Pułapki w samplowaniu negatywnych zdarzeń

Często podczas pozyskiwania informacji, otrzymujemy od naszych klientów dostęp do danych składających się wyłącznie z pozytywnych zdarzeń np. listy przedmiotów zakupionych przez każdego użytkownika lub klikniętych reklam.

Wiele modeli uczenia maszynowego, aby móc prawidłowo oszacować prawdopodobieństwo pozytywnego zdarzenia potrzebuje też negatywnych zdarzeń. Mogą to być przedmioty, których użytkownik nie kupił podczas wizyty w sklepie (pomimo tego, że miał szansę je kupić) lub reklamy, które zobaczył, ale ich nie kliknął. W części projektów tych negatywnych zdarzeń jest tak dużo, że przetwarzanie ich wszystkich jest zbyt czasochłonne. W takich sytuacjach stosujemy samplowanie negatywnych zdarzeń, czyli wybór losowego podzbioru ze wszystkich potencjalnie dostępnych negatywnych zdarzeń.

W takiej strategii konstrukcji zbioru treningowego trzeba uważać na kilka pułapek:

ważne jest to, aby nie wylosować jako zdarzenia negatywnego, zdarzenia, któremu odpowiadało identyczne zdarzenie pozytywne,
trzeba losować z pełnej przestrzeni dostępnych negatywnych zdarzeń, ale nie dopuszczać np. do tego, aby do zbioru treningowego trafiły sprzeczne dane np. zdarzenia zakupu produktu niedostępnego danego dnia lub zakupu ze sklepu stacjonarnego, który tego dnia był nieczynny.
w sytuacji, gdy chcemy odróżnić od siebie dobre rekomendacje produktów od średnich rekomendacji warto, aby w zbiorze treningowym w wylosowanych zdarzeniach były dobre i średnie rekomendacje, a nie dobre i kiepskie. Stosowaliśmy taką strategię przy okazji konkursu Recsys 2016 https://arxiv.org/pdf/1612.00959.pdf
jeśli predykcje modelu są używane jako dokładne oszacowania prawdopodobieństwa np. w celu policzenia oczekiwanego przychodu z wyświetlenia reklamy, to predykcje modelu wymagają rekalibracji. Robimy to dokładnie tak, jak zespół Facebooka w sekcji 6.3 w tej publikacji.

Pozostałe wpisy

Najświeższe wiadomości od MIM Solutions

Śledź nas

Wydarzenia

Piękny umysł a aukcje RTB

20 października Piotr Sankowski, CSO w MIM Solutions, wygłosił podczas Targów eHandlu w Warszawie prelekcję Piękny Umysł a aukcje RTB. Piotr przedstawił w niej fundamentalną

Blog

Sztuczna Inteligencja dla medycyny

Nowoczesna opieka zdrowotna coraz częściej korzysta z innowacji, które zawdzięczamy szybkiemu rozwojowi sztucznej inteligencji. W MIM Solutions zajmujemy się kwestiami związanymi z leczeniem niepłodności, ale

Aktualności

RecSys Challenge 2016

Zespół MIM Solution zajął drugie miejsce w RecSys Challenge 2016, konkursie odbywającym się w ramach Konferencji ACM Recommender Systems w Bostonie. RecSys to najważniejsze międzynarodowe

Kim jesteśmy?

MIM Solutions to firma wywodząca się z Grupy Algorytmików Uniwersytetu Warszawskiego, kierowana przez prof. Piotra Sankowskiego.

Firma zgromadziła ekspertów zainteresowanych sprawnym rozwiązywaniem praktycznych problemów algorytmicznych, które ostatecznie ewoluowały w kierunku uczenia maszynowego.

Dlaczego właśnie my?

MIM Solutions specjalizuje się w trudnych zadaniach. Jesteśmy biegli w dostarczaniu skutecznych rozwiązań, zwłaszcza gdy zawiodły standardowe metody.

MIM Solutions jest firmą zarejestrowaną w Krajowym Rejestrze Sądowym prowadzonym przez Sąd Rejonowy dla m.st. Warszawy XIII Wydział Gospodarczy Krajowego Rejestru Sądowego. KRS: 0000581404, NIP: PL5213710082.

Ochrona zdrowia

E-COMMERCE

Bezpieczeństwo

Inne

Ochrona zdrowia

E-COMMERCE

Bezpieczeństwo

Inne

Blog

Pułapki w samplowaniu negatywnych zdarzeń

Opublikowano: 3 lata temu

Udostępnij:

Blog

Pułapki w samplowaniu negatywnych zdarzeń

Pozostałe wpisy

Najświeższe wiadomości od MIM Solutions

Śledź nas

Piękny umysł a aukcje RTB

Sztuczna Inteligencja dla medycyny

RecSys Challenge 2016

Kim jesteśmy?

Dlaczego właśnie my?

Mati Projektuje

Copyright © 2024 MIM.ai. All rights reserved.

Polityka prywatności