Frank-ly

29 Jun 2009

artjacksonfailwhaleraulorozcoToen Michael Jackson vorige week overleed maakte het internet overuren. “Jackson dies and almost takes the internet with him” kopte CNN in.  Twitter barstte letterlijk uit zijn voegen. Er vlogen gemiddeld zo’n 1.000 tweets per minuut de tijdlijn in. En nog steeds houdt het de gemoederen op Twitter bezig. Via oud Rhinofly stagair @klaasman kwam ik deze leuke mashup tegen van de klassieker, met tijdloze beat, Billy Jean en de API van Twitter Search. Via tweets wordt de songtekst van het nummer weergegeven.

25 May 2009

Vanavond een beetje zitten kijken naar Real time search. Kwam bijvoorbeeld Collecta tegen. Die hebben twee voorbeeld pagina’s (over Obama en over de Mexicaanse griep) waarop goed te zien is hoe het een en ander dan in zijn werk gaat. Na een tijdje te hebben zitten kijken vraag ik me af wat er gebeurt wanneer er te veel informatie langs komt over een onderwerp.

Collecta komt deze maand naar het schijnt met een voor iedereen bruikbare variant inclusief de API. Wie ontwikkeld de eerste automatische retweet engine die alle relevante berichten uit die API weer retweet.

06 Jan 2009

Vanochtend even zitten met spelen met WhosTalkin, een zoekmachine gericht op het zoeken van informatie op social media sites en blogs. Het is het best te vergelijken met iets als Wie-o-Wie, maar (vooralsnog) sneller en met een keurige onderverdeling in subcategorieëen. Na het invoeren van je zoekterm wordt deze door een algoritme gehaald en wordt er razendsnel gezocht op iets meer dan 60 sites. Binnen luttele seconden worden je resultaten getoond en kun je met de filters aan de slag.

Er lijkt zich een serieus segment te ontwikkelen voor “social media searchengines”, waar eerder ook Social Mention (gebouwd op het Yahoo! BOSS-platform) en Delver zich al lieten zien. Een interessante ontwikkeling, dat is zeker.  Voor WhosTalking geldt vooralsnog dat het ontbreken van een RSS-feed of het kunnen opslaan van een zoekopdracht een flink gemis zijn. De applicatie is echter nog in beta, dus wie weet!

09 Dec 2008

Ik dacht zelf dat ik het al eerder gezien had, maar gezien de Google Blogsearch-results denk ik dat het een variant van Multicolr is. Multicolr is een tool waarbij er op basis van de door een bezoeker gekozen kleuren set een aantal Flickr-foto’s worden opgehaald. Multicolr komt uit de labs van Idee Inc en zoekt door 10 miljoen Creative Common licensed foto’s op Flickr of door 2,8 miljoen foto’s van Alamy.

Doen is geloven, in dit geval!
Ik vond het een grappige ervaring dat een individuele foto soms veel minder krachtig is dan het geheel van je zoekopdracht!

23 Jun 2008

We kregen vandaag een mooi berichtje van onze rond-de-wereld-reizende Usability Analist Esther van der Wel. Ze zit met haar vriend nu in Australië en kwam daar een fraaie campagne tegen op lantaarnpalen! Lees verder voor haar verhaal…

Lees het volledige bericht »

27 Apr 2008

Hakkend en zagend door mijn Google Reader liep ik vanochtend tegen een artikeltje van het Google Blog van een paar dagen terug aan. In dat artikel werd bekend gemaakt dat Google experimenteert met een uitbreiding voor de Googlebot op het gebied van HTML-formulieren. Het was niet zozeer de verrassing dat de Googlebot deze kan indexeren, dat wisten we al. Het experiment was echter gericht op het daadwerkelijk opslaan van formulieren, zodat de achterliggende pagina’s ook geindexeerd kunnen worden! Say what?

Het technische aspect van het opslaan van formulieren door de spider gebeurt volgens “…when we encounter a <FORM> element on a high-quality site, we might choose to do a small number of queries using the form. For text boxes, our computers automatically choose words from the site that has the form; for select menus, check boxes, and radio buttons on the form, we choose from among the values of the HTML. Having chosen the values for each input, we generate and then try to crawl URLs that correspond to a possible query a user may have made. If we ascertain that the web page resulting from our query is valid, interesting, and includes content not in our index, we may include it in our index much as we would include any other web page.”

Maar Google bedient zich in deze van “good Internet citizenship”, wat het ook waard moge zijn: “Needless to say, this experiment follows good Internet citizenry practices. Only a small number of particularly useful sites receive this treatment, and our crawl agent, the ever-friendly Googlebot, always adheres to robots.txt, nofollow, and noindex directives”

Pete Freitag vatte het volgende samen uit de hele post:

The Googlebot will NOT submit forms that:

  • Use method="post"
  • Have password fields
  • “Use terms commonly associated with personal information such as logins, userids, contacts, etc”
  • Have a form action that is forbidden in robots.txt

We kunnen uit ervaring melden dat de Googlebot zijn “good Internet Citizenship” nog wel eens vergeet en lekker toch doorjakkert. Alleen de form-actie in de Robots.txt als forbidden zetten bied dan uitkomst.

Voor back-end developers dus nog even rust. Geen vage records in de database van de Googlebot. Althans, voorlopig nog niet dan.

23 Apr 2008

twist Al het online gepraat is een goudmijn voor data-analisten en trendwatchers. Er zijn al vele initiatieven en producten die de blogosfeer en fora monitoren om de engagement rondom merken en merknamen te indexeren, monitoren en te waarderen. Een van de voorbeelden is Blogpulse, maar er zijn er vele anderen te noemen. Voor Twitter zijn er ook al diverse diensten zoals Tweetscan. Maar er is een nieuwe ster opgestaan en wel Twist. Twist is te vergelijken met Blogpulse of Google Trends, waarbij je trefwoorden kunt vergelijken over tijd. Zie hier bijvoorbeeld het getwitter van afgelopen weekend over de voetbalclubs. Een interessant nieuw instrument waar we denk ik nog wel meer van gaan horen.

21 Apr 2008

In januari schreven we hier op Frank-ly al eens over de vernieuwende manier waarop Google bezig is met het presenteren van zoekresultaten. Het gebeurt openbaar en ze staan open voor input voor verbetering. Maar het wachten was op de eerste “echte” resultaten van deze werkwijze. Tot gisteren, toen ik opeens een extra zoekoptie ontdekte bij Google Maps: “resultaten beperken tot webpagina’s op de kaart”.

mapssearch.JPG

Het gevoel wat ik bij deze nieuwe optie kreeg was erg tweeledig. Ja, het is een hele frisse blik op het zoeken van data op internet.  Je bekijkt informatie vanuit hun geografische locatie, in plaats van het zoeken op globale termen. Maar vooralsnog blijven zoekresultaten voornamelijk bestaan uit Wikipedia-pagina’s en hotel-sites. Of krijg je een geheel verkeerde locatie door, omdat de ISP van de betreffende pagina in Amsterdam zit (zoals bij ons het geval is :-) ) . De service functioneert ook niet helemaal zoals je zou verwachten, want de kaart blijft beperkt tot wat je voor je hebt. Wil je vanuit je kaart van de USA zoeken naar een Nederlandse website, zul je eerst naar Nederland moeten gaan en daar je zoekopdracht opnieuw moeten uitvoeren.

Wat opvalt is het feit dat Google de optie stilletjes heeft toegevoegd. Geen toeters, bellen en confetti – of op zijn minst een officieel releasestatement. Het draagt bij aan dat gevoel van experimenteren…. dat dan weer wel!

26 Feb 2008

search

Zou het zo kunnen worden in de toekomst?

(Via Marikaya)