Le système de compatibilité entre les collections des membres

Général > Anime-Kun Feedback

<< < (2/11) > >>

Diyo:

--- Citation de: shadow8 le 28 novembre 2013, 18:31:34 ---Non, j’essayais de dire subtilement que les notes 1 à 10 c'était mieux.On en avait déjà parlé et la discutions était intense avec certains membre. Il est trop tard de tout façon. :'(

--- Fin de citation ---
Ah d'accord. Je ne pense pas que l'impact sera réellement signifiant. On verra bien.

Aflo, tu as l'air de connaître un peu le sujet... Peux-tu m'expliquer pourquoi le coefficient de corrélation est de 0 (aucune corrélation donc) pour ces deux tableaux:
$array_x = array(5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5);
$array_y = array(5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,4);

Via la formule, je comprends pourquoi on a 0 comme résultat (une division par 0 d'ailleurs). Mais ce que je ne comprends pas, c'est qu'on devrait plutôt tendre vers le 1 là...

Down:
La formule n'est simplement pas valable (n'a pas de sens) pour un tel cas, puisque ton numérateur comme ton dénominateur sont nuls. Dans le cas improbable où un membre aurait une thèque d'écart-type nul, il faut utiliser une autre formule...

Sinon, je pense qu'il est utile que les forts écarts de notes soient particulièrement pondérés, mais de ce que je comprend du coeff de Pearson c'est à peu près le cas...

--- Citation de: shadow8 le 28 novembre 2013, 18:31:34 ---Non, j’essayais de dire subtilement que les notes 1 à 10 c'était mieux.On en avait déjà parlé et la discutions était intense avec certains membres. Il est trop tard de tout façon. :'(

--- Fin de citation ---

Il se trouve qu'en utilisant Pearson sur une thèque "normale", ce type d'écart n'aura pas trop d'importance, puisque d'une part les notes sont recentrées sur la moyenne, et d'autre part les plus fortes contributions sont celles des notes les plus écartées de la moyenne (donc les 5* et les 1*, ce qui se tient à priori) pour lesquelles un point subjectif de différence ne signifie pas grand chose.

Afloplouf:
La corrélation de Pearson ne marche aussi que sur des ensembles de tailles égales. Deux membres auront rarement le même nombre de titre entre leur deux thèques. Si on se restreint à ceux qu'ils ont en commun c'est facile mais alors on ignore complètement ceux qu'il n'ont pas en commun ? Et encore ça on a pas trop le choix forcément mais moins ils ont des titres en communs, moins ce coefficient est proche de la réalité (joie des stats, plus tu as de données, mieux c'est)... Pas si facile que ça en effet. Je garde ça dans un coin de ma tête et j'y réfléchis. :P

Edit : Tiens, essaye de jeter un oeil au coefficient de Spearman.

Diyo:

--- Citation de: Afloplouf le 28 novembre 2013, 19:53:04 ---Edit : Tiens, essaye de jeter un oeil au coefficient de Spearman.

--- Fin de citation ---
Ah merci, ça m'a l'air plus adapté que Pearson. Je vais tester.

Sinon, quelqu'un aurait une piste pour la partie A de mon premier post? Je ne sais pas par quel bout prendre le problème.

manga-fan66:
Bon je suis pas un gros matheux donc les nom des théorème toussa toussa je les ai pas en tête mais bon pourquoi pas faire un système de moyenne tout bête ?

En gros si deux personne A et B tel que :

- A à 25 anime dont 8 en commun avec B
- B à 60 anime dont bien entendu 8 en commun avec A

En gros :

A à 100 * 8 / 25 = 32% d'anime en commun avec B
B à 100 * 8 / 60 = 13,3% d'anime en commun avec A

Tu peut traiter ses chiffres de plusieurs façons :

- Soit dire qu'à partir d'un certain pourcentage (genre 50%) une personne est "compatible avec l'autre". Celà inclut donc qu'il peut ne pas y avoir réciprocité, genre A compatible avec B car il vu moins d'anime mais pas l'inverse.
- Soit faire en sorte qu'il y est forcement réciprocité et donc faire tout bêtement une différence entre leur deux pourcentage et fixé un seuil pour dire si oui ou non les deux sont compatible. Genre dans mon exemple 32 - 13 = 19% si tu fixe le seuil à on vas dire 10% (plus le seuil est faible plus il auront une animethèque semblable) et bien c'est pas bon, les deux ne sont pas compatible.

- L'avantage du second choix c'est qu'ils auront plus d'anime commun et pourrons ainsi théoriquement s'entendre mieux.
- L'avantage du premier choix c'est que celui qui a vu moins d'anime pourra s'inspirer des autres animé qu'il n'a pas encore vu chez l'autre. Surtout si la notation est similaire chez les deux (voir méthode ci-dessous). Après tout dépend de ce que tu recherche à faire :)

Ensuite pour mettre en corrélation avec les note des animé en question. Tu vérifie que déjà il ai en commun assez d'anime (via la méthode que j'ai détaillé précédemment). Puis tu récupère la valeur absolue de la différence de leur note, anime par anime, puis tu additionne le tout et tu fais la moyenne. Plus la valeur sera élevé, plus ils auront des notes différentes et donc une mauvaise compatibilité. Exemple :

Voici les notes des anime que A à en commun avec B (dans le même ordre bien sûr) : 2 ; 3 ; 3; 1; 2; 5
Voici les notes des anime que B à en commun avec A (dans le même ordre bien sûr) : 2; 4; 4; 2; 4; 1

Cela donne : (0 + 1 + 1 + 1 + 2 + 4) / 6 = 1.5

Si tu fixe un seuil à 1 par exemple, ce qui signifie une différence de 1 par note en moyenne par anime qu'ils ont en commun, dans ce cas ils ne sont pas compatible :)

Pour les tags je vois juste pas ce que tu veut dire, il me faut un exemple :)

Si je me suis mal exprimé, que je n'ais pas compris ta demande, ou que tu veuille que je réexplique pas de soucis ;)

Navigation

[0] Index des messages

[#] Page suivante

[*] Page précédente

Utiliser la version classique