Channels
Powered by True

Opensource-zoekmachine Wikia van start gegaan

Door Mick de Neeve, maandag 7 januari 2008 20:05, views: 16.069

De alphaversie van Wikia Search, de opensource-zoekmachine van Wikipedia-oprichter Jimmy Wales, is officieel van start gegaan. Naar eigen zeggen is de kwaliteit van de resultaten nog vrij mager, maar gebruik van de engine moet dat verbeteren.

Wikia Search Volgens Wales is een open zoekmachine nodig omdat de algoritmes van de commerciële diensten zoals marktleider Google geheim zijn, en volgens de Wikipedia-oprichter is zelfs een algoritme een redactionele stellingname.

Zoekmachines dienen volgens Wikia gebaseerd te zijn op vier basisprincipes. De werking moet transparant zijn, de internetgemeenschap moet er aan bij kunnen dragen, de resultaten moeten van voldoende kwaliteit zijn en de privacy van de gebruikers dient te worden beschermd.

De community focus van de zoekmachine wordt onder meer vormgegeven door gebruikers resultaten te laten beoordelen. Maar openheid over de achterliggende algoritmes is het belangrijkste, aldus Wales tegen Ars Technica. De invloed die commerciële zoekmachines op de voorgeschotelde resultaten hebben is hem een doorn in het oog. Wales meent dat de perceptie dat met de computer gegenereerde informatie 'neutraal' is, op een misvatting berust. De mogelijkheid dat website-eigenaren de beschikbaarheid van de code misbruiken om te proberen hun eigen site hoger geplaatst te krijgen neemt hij voor lief.

De ontwikkeling van de engine heeft een jaar geduurd, en kwam medio vorig jaar in een stroomversnelling na de overname van de webcrawler Grub.

query 'tweakers' op Wikia Search

Volgende: Nederlandse Office 2008 voor de Mac vanaf 20 februari te koop 20:47
Vorige: Intel presenteert zestien nieuwe processors met 45nm-techniek 19:03

Reacties

«  1  2  3  »

Beetje mager inderdaad, geen google vervanger.

google was toen ze begonnen ook geen altavista vervanger... moet je nu eens kijken.

Hmm, ik vind wel misplaatst dat je mogelijk misbruik door open code voor lief kunt nemen. Het haalt de betrouwbaarheid van je zoekmachine onderuit. Je zoek algoritmen moeten betrouwbaar en nauwkeurig zijn.
Een van de meest irritante zoekresultaten op een zoekmachine zijn al die hits van ebay, marktplaats, etc. Als ik grasmaaier intik op google, dan ben ik waarschijnlijk niet naar een 2e handsje op zoek.

edit: tnx Corrit, die extensie staat er bij mij nu ook op :)

[Reactie gewijzigd door DoubleD79]


Als je firefox gebruikt kun je met de extensie CustomizeGoogle resultaten van bepaalde sites er automatisch uitfilteren. :)

hé thx..
da irriteerde mij nu zo..
zocht de specificaties op van bv een moederbord..komt eerst 30 shops tegen..

Tip: die is er trouwens ook voor IE: http://www.cg4ie.com/ :)

Een Google is tegenwoordig ook niet helemaal betrouwbaar meer hoor, met linkfarms en zogenaamde SEO-bedrijven die erop gericht zijn om webpagina's hoger in de resultaten te krijgen die er eigenlijk niet horen. Ik heb liever een zoekmachine die let op de kwaliteit en relativiteit van een pagina dan een die let op hoe vaak ernaar gelinkt wordt, ook al zit daar beveiligingen in tegen teveel valse links en dergelijke.

dat doen ze met iedere zoekmachine die maar een beetje bekend is. Dus bij deze ontkom je daar ook niet aan.

Inderdaad en niet alleen dankzij linkfarms maar ook gewoon goed opgezette websites. Laatst had ik namelijk een heel vaag gevalletje:
Ik zocht voor een klant (kledingwinkel) naar de website van een merk om foto's op de site van de klant te zetten, maar het vreemde was is dat ik als resultaat een andere website (door mij gemaakt) bovenaan kwam te staan! Dit terwijl die andere website niet eens het zoekwoord bevat waar ik naar zocht en deze site van de lokale buurtkrant is. Aan Seo of linkfarms doe ik niet, de site van de buurtkrant is alleen maar in css geschreven. Moet je mij uitleggen hoe dat kan!

ik denk dat je behoorlijk wat informatie mist hier om deze stelling zo te plaatsen.

het is namelijk bekent (sorry even geen zin in links) dat google juist een van de felste zoekmachines is tegen linkfarms en optimalisatie - en bovendien door zo geheim te blijven als 't is, zijn er heel wat bedrijven die wel beweren dat ze met/voor google kunne werken maar dat in werkelijkheid helemaal niet kunne ..

bekend is bijv dat google actief speurt naar spelbrekers en die vervolgens gewoon weg totaal uit de index haalt of bijv 100 plaatsen naar beneden haalt ...


ik snap daarmee dus ook dit initiatief van wiki niet...
een zoekmachine kan (mijns inziens) namelijk niet objectief kijken naar welke de beste site is zolang iedereen weet met welke tricks je hoger in de lijst komt...

met andere woorden, maakt hij het malafide webdevvers wel heel makkelijk om bovenaan te komen,

en daarmee is 't dus voor mij iig wel bijna zeker dat deze search-engine gedoemd is te mislukken (of iig op het grote boze internet, ik zie dan ook meer in een eigen zoekmachine voor je bedrijf oid op basis van deze code dan een website ala google.

ik blijf er daarom ook een beetje bij de google-mening die min of meer steld dat,
" als julie nu je best doen om zo goed en duidelijk mogelijke websites te bouwen, doen wij onze best om een zo goed mogelijk algarytme te maken dat ook daadwerkelijk de beste bovenaan plaats'

en naatuurlijk praat ik hier over een machtige gooooooogle waar iedereen wel eens een vreemd onderbuik gevoel van krijgt, maar, in de regel verwacht ik van google geen apensteken, en bovendien, je privacy begind bij jezelf ....(ik ga tenslotte ook niet over straat lopen met een bordje op m'n rug, " mijn bankrek nr = / en mijn pincode = "


JIJ WEL????????

Dat is niet misplaatst. Dat is nou juist de essentie.

De stelling is dat geheime algoritmen ook een vorm van zoekmachine manipulatie zijn en dat de maatschappelijke gevolgen daarvan erger zijn dan die van externe manipulatie pogingen door mensen die het algoritme kennen.

Het idee is dat iets slechtere zoekresultaten acceptabel zijn als je weet hoe ze tot stand komen, en hoe het mogelijk gemanipuleerd kan zijn, terwijl je privacy beschermt wordt. (google en MS tracken alles wat je doet).

Het is het min of meer standaard idee binnen de Open Source beweging dat vrijheid boven andere eigenschappen plaatst. Als het moet is men bereid daarvoor op andere gebieden in te leveren.

Dat wil overigens niet zeggen dat dat inleveren echt gaat gebeuren. Een andere overtuiging binnen de Open Source beweging is namelijk dat open code per definitie beter is dan gesloten code omdat die door zoveel mensen bekeken en verbeterd kan worden. Dus dit zou zelfs een betere zoekmachine op moeten leveren.

Of dat allemaal waar is en hoe het uit gaat pakken ?
Geen idee, dat zullen we dus gaan zien. In het slechtse geval is dit een mooi experiment, in het beste geval is google over 5 jaar de volgende altavista.

Een van de meest irritante zoekresultaten op een zoekmachine zijn al die hits van ebay, marktplaats, etc. Als ik grasmaaier intik op google, dan ben ik waarschijnlijk niet naar een 2e handsje op zoek.
Als je zo'n summiere zoekopdracht doet, ben ik verbaast dat je uberhaubt krijgt wat je zoekt. Hoe moet een zoekmachine weten dat je niet op zoek bent naar een gebruikte? Je kunt trouwens excluden.

Uiteraard tik ik meer in dan 1 woord en uiteraard kun je ook een hoop excluden. Ik beschouw die hits van 2e hands sites en veilingsites als spam. Je installeert toch ook geen spamfilter omdat je spam accepteerd maar niet op je pc wilt? Wat ik duidelijk wil maken is dat filteren en verfijnen geen eis moet worden om een paar goede hits te hebben.

AFWACHTEN op hoe goed de gemeenschap de ideeen kan verwezenlijken


Waarom? Niemand verplicht je die te gebruiken

Waarschijnlijk zie jij om de een of andere reden aan als spyware, maar dat is het niet...

Het programma heeft als doel jouw nog sneller van zoekresultaten (ook die op jouw computer) te voorzien, zo kan je bijvoorbeeld twee keer control drukken, tweakers intypen en enter drukken. (Of grasmaaier -ebay :D) Voila, resultaten!

[Reactie gewijzigd door TomWij]


nee hoor, het programma heeft als doel om je zoekopdrachten nog beter te kunnen analyseren (ja, je surfgedrag wordt naar google gestuurd!), zodat ze nog betere advertenties kunnen verkopen.

Daarbij heb ik m'n zoekresultaten in <0.2 seconden, dus heel voor de snelheid hoef je het niet te doen.

Er worden enkel dingen naar Google gestuurd als jij dat expliciet vermeld, dus standaard stuurt het geen persoonlijke gegevens (dingen zoals je surfgedrag en dergelijke) naar Google.

Het kan wel zo zijn dat als jij online iets zoekt dat de zoekterm wordt bijgehouden in een log, maar dan wordt dit gedaan om de zoekresultaten (en natuurlijk de advertenties, het blijft een bedrijf, het moet ergens zijn geld vandaag halen, anders zou Google niet bestaan of niet zo groot zijn) te verbeteren.

Lijkt me sterk dat als jij een artikel aan het typen bent in Microsoft Word dat jij dan zonder een openstaande browser in minder dan 200 msec zoekresultaten op het internet of in jouw e-mails hebt...


Misschien even zoeken op Google? :)

http://alpha.search.wikia.com/ dat is de link naar de cleane interface

De resultaten moeten niet van voldoende kwaliteit zijn, maar van uitmuntende kwaliteit. De alternatieven zijn daar inmiddels te goed voor.

Wat willen ze bereiken met 'Mini Article About "searchstring"'?
Lijkt net een wikipedia kloon maar dan over sites. :O

Ik ben van mening dat er veel te weinig mensen weten hoeveel invloed commercie op het dagelijks leven uitoefent. Doordat de overheid goed mee profiteert van al onze aankopen, zullen zij de laatste zijn die zelf achter de oren zullen krabben. Laat staan dat er een initiatief wordt ontworpen, of gevraagd te maken, waarbij de marktwerking niet van invloed is. Overal zie je dat bedrijven en overheden meer samenwerken, zoals scholen en stages voor het bedrijfsleven. Vervolgens zijn het deze "vrijwilligers" die weer in onwetendheid meewerken aan het bestaan van dit bedrijf en laat dit nou net het bedrijf zijn die jou dagelijkse SPAM toestuurd. Dit wordt aangewakkerd door andere bedrijven waarmee samen wordt gewerkt, die bieden namelijk geld voor info van het klantenbestand voor SPAM. Ik dwaal niet af.

Ik zie namelijk ook Google en andere commerciële sites, graag gebruik maken van de optie SPAM, maar dan met het masker 'hit'. Alsof ik die Kelkoo-sh*t steeds maar weer te zien krijg, ja dan klik ik er uiteindelijk wel een keer op. Maar welke aap wil een Kelkoo-review lezen als je zoekt naar een bios... gvd. En ik mag niet onderzoeken of ik daadwerkelijk te zien krijg waar ik en gezamelijk andere échte mensen (fake uitkomsten dus) waar wij dus écht naar zoeken.

Klopt het wel. Vraag het je in godsnaam eens af. Breek door de facade heen, neem het heft in eigen handen. Ode aan ons allen, niet alleen de meerderheid.

Wat heb jij gerookt zeg? Ik begrijp dat je niet blij bent met de hits van Google, maar je brengt het op zo'n manier dat ik bijna dacht dat je een script voor de Matrix 4 aan het quoten was.

Je had ook gewoon kunnen schrijven: Ik vind dat er tussen de hits van Google te veel gesponsorde links zitten. Dat leest wat makkelijker.

[Reactie gewijzigd door Bas T]


Verder zijn de gesponsorde hits betrekkelijk goed aangegeven - dus ook dat mag geen probleem zijn.

Van een beetje tweaker mag je toch verwachten dat hij/zij ziet welke hits er gesponsord zijn en welke niet - in elk geval op Google...

"did you mean <slightly different search string> ? citation needed"

Waar kan je de source dan downloaden? Ik kan het niet vinden (ook niet met Google).
«  1  2  3  »

Op dit item kan niet meer gereageerd worden.

Volgende: Nederlandse Office 2008 voor de Mac vanaf 20 februari te koop 20:47
Vorige: Intel presenteert zestien nieuwe processors met 45nm-techniek 19:03

Powered by True
RSS VNU Media logo
© 1998 - 2008 Tweakers.net - Alle rechten voorbehouden
Uitgever van: