Oi gente!
Somente relembrando a postagem sobre o MHC: Método Hibrido Comparativo, eu fixei algumas metas sobre esse método. É importante você ler aquela postagem para entender essa.
Cheguei em um bom termo em meu objetivo de estipular parâmetros para observar a evolução de sites na internet. Quem estiver ávido por rankings e gosta de disputas gostaria que ignorasse meu trabalho. Meu objetivo não é alimentar querelas sobre qual site é melhor do que o outro, mas oferecer dados de comparação, principalmente para quem deseja conhecer melhor o comportamento de websites com relação aos indíces divulgados. Na prática minhas pesquisas respondem àquela pergunta se o PageRank é ou não válido? Pois eu o comparo com outros índices como backlinks e a indexação de dos sistemas de busca.
1) Definir segmentos, e sub-segmentos de websites.
Por esse motivo retirei da lista original dezesseis domínios que distorciam completamente os dados. A questão central do MHC é estipular faixas que podem ser comparadas.
Um número determinante para considerar a distorção referida, foi o somatório do Yahoo e do Google, na amostra que incluiu 86 domínios, veja os dados:

Os Três fatores para definir quem estava dentro ou fora da pesquisa:
1) Pouca variação entre os seus números e o somatório.
Veja o caso do Interney por exemplo, que possui 1.916.530 páginas indexadas pelo Yahoo. Será que isso é possível? Já que a amosta possui 3.247.243. Eu sei que o Interney é foda ,mas indexar metade da lista? Alguma coisa está errada. Os universitários me explicam?
É evidente que o interney é favorecido pelo fato do seu domínio abrigar vários subdomínios em diretório físico. O Yahoo! não conseguiu fazer essa distinção. O problema é que as pessoas utilizam esses dados por aí para colocar o cara no topo. Aí é que está a minha preocupação em desenvolver um método comparativo. Em outra edição poderei colocá-lo na lista basta encontrar um fator objetivo de correção.
2) Influência de domínios e subdomínios.
Pois bem, o Interney é beneficiado pelos seus subdomínios e o que dizer do Querido Leitor com Alexa 42? Seria o máximo não fosse o Alexa confundir seu domínio com o servidor uol, no qual o site dela está hospedado. No caso desse mesmo site existe um outro agravante: ela possui 22 páginas indexadas pelo Google e 42 indexadas pelo Yahoo. Eu já havia notado que o sistema de links permantes dela é ancorado. Sei lá é uma coisa estranha quando vamos acessar o site dela. Não dá para achar uma página específica, mas abre uma âncora. Tá aí uma dica grátis para o pessoal do UOL pensar melhor sobre isso. Já pensou se essa mulher tivesse um domínio próprio? Mas aí perderia a influência do portal? O que é melhor?
KibeLoco, Biajoni e Renê de Paula - sempre sonhei colocá-los lado a lado – estão na mesma situação, sua indexação é péssima.
Para comparar esse tipo de site atualmente, é necessário utilizar outros parâmetros.
Dentro dessa mesma questão da influência tive que retirar um site que era feito por mais de três editores. Eu sei que é um critério muito arbitrário e pouco objetivo. Mas o trabalho deles está mais para revista, que seria uma subdivião interessante também. Esse é o caso do Papo de Homem, MeioBit, MacMagazine, Obvious, Vaca e Portal da Administração.
3) Inexistência de dados
Ironicamente não achei o Blog da Guerrilha no Technorati, além disso parece ser um site feito por uma equipe também. Qualquer site que não possua os parâmetros que mencionei na primeira postagem, é impossível ser equiparado aos outros.
Veja na tabela e tire suas conclusões sobre o que eu afirmei:
Dessa forma foi possível selecionar uma amostra de 70 sites para realizar o MHC:


Para não ficar muito cansativo vou fazer uma terceira postagem e demonstrar como cheguei finalmente ao meu IHC (Índice Híbrido Comparativo).
Essa pesquisa colocou dados muito interessantes na minha mão. Se você desejar receber mais detalhes sobre ela entre em contato.
Lembro a todos que a discussão sobre o MHC está aberta em nossa comunidade no Via6.
Abraços e até a próxima.



