Général > Anime-Kun Feedback

Le système de compatibilité entre les collections des membres

(1/11) > >>

Diyo:
BON! J'en appelle aux matheux (il y en a j'espère!!) concernant le système de compatibilité entre les membres. Comment procéderiez-vous? Quel algo vous semble le plus pertinent? Sachant que j'aimerais bien prendre en compte:

A. le nombre de titres qui se retrouvent dans deux collections -> 45%
A ce sujet, il faut faire attention au fait qu'un membre qui n'a que 10 titres dans son animethèque risque d'être 100% compatible avec un autre qui en a 500. Bref, il va falloir pondérer.

B. les évaluations (étoiles) entre mêmes titres de deux collections différentes -> 45%
Il y a des algorithmes de corrélation (le coefficient de corrélation de Pearson par exemple) qui existent mais je ne suis pas sûr qu'ils soient vraiment adaptés.

C. Les centres d'intérêt (tags) -> 10%
Ca me paraît moins pertinent.



Partons d'un exemple concret des collections de deux membres X et Y. Voici leurs animethèques sous forme de deux tableaux :

X = (1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20)
Y = (2,4,6,8,10,12,14,16,18,20,22,24,26,28,30)

10 animes (2,4,6,8,10,12,14,16,18,20) se retrouvent dans les deux collections sur un total de 35 animes (20+15).
Comment faire pour calculer une compatibilité à partir de ces données? Je sèche un peu.


Maintenant, à partir des 10 animes qui sont dans les deux collections, on crée les tableaux d'évaluations (sur 5) dans l'ordre des identifiants des animes :

X_evaluations = (5,2,3,5,1,5,4,3,3,2)
Y_evaluations = (5,3,3,1,2,5,3,4,4,2)

En utilisant le coefficient de corrélation de Pearson, ça me retourne 0.38 (soit 38%). Je suppose que c'est pertinent... Qu'en pensez-vous? Y-a-t-il moyen d'utiliser un calcul plus adéquat?

Plus d'info sur le coeff de corrélation :
http://fr.wikipedia.org/wiki/Corr%C3%A9lation_%28statistiques%29,
http://en.wikipedia.org/wiki/Pearson_product-moment_correlation_coefficient,
http://easycalculation.com/statistics/learn-correlation.php,
http://www.er.uqam.ca/nobel/r30574/PSY1300/C4P7.html


Et enfin la comparaison des deux nuages de tags. Je n'y ai pas encore réfléchi  :lips:


Alors? Des suggestions?
Merci pour votre aide!

shadow8:
Bon, je ne suis pas trop matheux, mais j'ai un commentaire à faire peut-être pertinent.  Le système d'étoile peu porté à confusion vu que le système peut être vu différent  par certains membre. Par exemple le 3 étoile peu être considéré comme comme 5 par un et un autre comme un 6 ou un 7.  À moins que cela ne change pas grand chose.

Cela doit faire de lustre que je n.ai pas fait des maths.

Afloplouf:
Alors mes souvenirs de stats, le coeff de Pearson est effectivement le plus utilisé. A toi ensuite d'attribuer les poids qui t'intéressent pour chaque critère, bref de faire de la logique floue sans le savoir. :ninja:

Diyo:

--- Citation de: shadow8 le 28 novembre 2013, 18:19:14 ---Bon, je ne suis pas trop matheux, mais j'ai un commentaire à faire peut-être pertinent.  Le système d'étoile peu porté à confusion vu que le système peut être vu différent  par certains membre. Par exemple le 3 étoile peu être considéré comme comme 5 par un et un autre comme un 6 ou un 7.  À moins que cela ne change pas grand chose.

--- Fin de citation ---
Ca me désole vraiment mais malheureusement je ne peux pas encore entrer dans la tête des gens :P
On fera avec ce qui est utilisable: des données.

shadow8:

--- Citation de: Diyo le 28 novembre 2013, 18:28:43 ---Ca me désole vraiment mais malheureusement je ne peux pas encore entrer dans la tête des gens :P
On fera avec ce qui est utilisable: des données.

--- Fin de citation ---

Non, j’essayais de dire subtilement que les notes 1 à 10 c'était mieux.On en avait déjà parlé et la discutions était intense avec certains membres. Il est trop tard de tout façon. :'(

Navigation

[0] Index des messages

[#] Page suivante

Utiliser la version classique