• Reset your password

User account menu

  • Artikler
  • Forside
  • Forum
  • Nyheder
  • Log in
Hjem
Linuxin 2025

Breadcrumb

  • Hjem
  • forums
  • Data mining

Hvad kan du med 100% sikkerhed sige, at du har stemt?

Valgmuligheder
Af tuxedo | 07.11.2008 17:03

Data mining

Programmering

Jeg skal til at skrive nogle funktioner til data mining og statistik, men hvilket programmeringssprog er egentlig bedst egnet til formålet - Java eller Python?



Jeg har lavet nogle forsøg i begge sprog. Java koden kører generelt hurtigere, men er mere bøvlet at programere i (min erfaring). Python kan jeg godt lide af forskellige årsager og det egner sig godt til formålet, men Java virker mere "professionelt" (min tolkning). F.eks. er funktionerne til dokumentation af koden bedre end i Python.



Der er fordele og lumper ved begge sprog.



Jeg vil gerne have noget at vide om hvilket sprog du ville vælge og hvorfor.


  • Log in to post comments

Kommentarer6

16 år 6 måneder siden

Permalink

Indsendt af Kresten Kjaer den 7. november 2008 kl. 20:10

Permalink

java + python

Jython?

http://en.wikipedia.org/wiki/Jython

http://www.jython.org/Project/



Som sagt, der er fordele og ulemper ved begge sprog. De kan begge klare opgaven. Vælg det du er mest flydende i.

  • Log in to post comments

16 år 6 måneder siden

Permalink

Indsendt af isaksen den 15. november 2008 kl. 22:28

Permalink

Re: Data mining

Men er de fleste funktioner/regnemetoder ikke lavet i forvejen? Det er selvfølgelig en god øvelse at lave dem selv!

fx http://www.cs.waikato.ac.nz/ml/weka/

eller bare http://sourceforge.net/search/?type_of_search=soft&words=data+mining


  • Log in to post comments

16 år 6 måneder siden

Permalink

Indsendt af tuxedo den 22. november 2008 kl. 17:26

Permalink

Svar til #2...
Jo langt de

Svar til #2...



Jo langt de fleste findes allerede et eller andet sted, som f.eks. WEKA, men jeg har nogle jeg selv har udviklet i MATLAB og tænkte at det ville være rart at have adgang til dem i f.eks. Python eller Java da jeg ikke længere har adgang til MATLAB. Jeg har allerede implementeret nogle særlige metoder til genetiske algoritmer, neurale netværk samt klustering. Disse metoder er implementeret i Python fordi jeg godt kan lide sproget og fordi det på mange måder minder mig om MATLAB. Jeg er mest stemt for at fortsætte med at bruge Python,



Jeg ville dog gerne høre om der er noget der taler imod at bruge Python til data mining. Her tænker jeg især på faktorer som performance og skalerbarhed.

  • Log in to post comments

16 år 6 måneder siden

Permalink

Indsendt af isaksen den 22. november 2008 kl. 23:32

Permalink

flamebait

Du lyder som en jeg snakkede med for 2 år siden på JAOO!



Men hvis jeg var dig ville jeg lave en poc i python, og hvis du når til at have god "performance" ville jeg skrive en lille del i c/c++.



skalerbarhed? horisontal eller vertikal?

personligt ville jeg vælge Java og noget rmi halløj hvis jeg ville lave noget der lavede vertikal skalering.

ellers hvis det er horisonttal: python med måske c/c++.



Der findes rmi til python http://pyro.sourceforge.net/ pyro! Jeg har dog ikke rørt det! men mit argument falder til jorden



men hvis du er bange for at dit python ikke yder godt, har du så set http://psyco.sourceforge.net/

  • Log in to post comments

16 år 6 måneder siden

Permalink

Indsendt af tuxedo den 23. november 2008 kl. 19:58

Permalink

Numpy + SciPy

Jeg har (for sjov) kørt et forsøg med at benytte de fremragende biblioteker NumPy og SciPy til Python. Det er biblioteker hovedsageligt til numeriske beregninger.



Jeg kørte en klustering algoritme på et stort datasæt i hhv. ren Python, Python med Numpy + SciPy, og Java. NumPy + SciPy metoden var klart hurtigst!



#4:

Mht. skalerbarhed så tænkte jeg mest på horisontal skalerbarhed. Jeg er begyndt at genopfriske mine C kundskaber. Jeg har nu mest tænkt mig at fortsætte med at udvikle i Python og så optimere hen ad vejen i C hvis det bliver nødvendigt.



Måske jeg ikke er helt på afveje?



Tak for linket til Psyco!

  • Log in to post comments

16 år 6 måneder siden

Permalink

Indsendt af tkjacobsen den 25. november 2008 kl. 08:31

In reply to Numpy + SciPy by tuxedo

Permalink

Re: Numpy + SciPy

Jeg har samme erfaring. Skriv det meste af koden i numpy+scipy. Kør det gennem en profiler. Optimer de svage punkter i C/Fortran..



Så set fra min side er du bestemt ikke på afveje. (medmindre jeg også er det)

  • Log in to post comments

Svar søges

Test 0
Den er go 0
Vil du have et sikrere og mere privat internet? Du skal blot installere Vivaldi-browseren med Proton VPN understøttelse! 0
14. februar = I Love Free Software Day 0
Lokal fil-deling - for de dovne. 0

Seneste aktivitet

"Intet realistisk alternativ" - mig i r*ven 5
2 stk Jolla C2 sælges 2
Test 2
Det første forumindlæg efter installation af Forum-modulet 8
Vanilla OS 12
Nye forum-indlæg viser sig kun 1 gang 1
Vil alle forumindlæg vise sig to gange 1
Hjælp til remote terminal vindue? 3
PCLinuxOS 19
Kan ikke boote på installation 24
80-20 reglen 1
Skærmlys fader ud på min bærbare 8
32 bit distro på max 700mb der stadig understøttes 26
Har vi nogen Linux konsulenter i Slagelse området? 3
Virkelig 7
gnome-software? 3
Archer T2U AC600 Wireless Dual Band USB Adapter 26
En farverig APT 3.0 udgivelse imponerer med sine nye funktioner 2
Unix's fødsel 2
Linux Mint 13

Copyright © 2025 Company Name - All rights reserved

Developed & Designed by Alaa Haddad