Autor |
Nachricht |
Minnie
|
Betreff des Beitrags: Prüfungsfrage zum Clustering Verfasst: 08.05.2014, 08:16 |
|
Versuchskaninchen |
|
|
Registriert: 06.02.2008, 14:51 Beiträge: 17
|
Hallo, vl. ist ja jemand auch am lernen für die Bioinformatik Prüfung...
Ich bin mir nicht sicher bei der Beantwortung der Prüfungsfrage zum clustering: "Ist es schlimm wenn die werte mit unterschiedlichen Scales gemessen werden? Muss man sie vereinheitlichen?" was würdet ihr da antworten? Danke für Vorschläge! Lg Minnie
|
|
|
|
|
Michaela
|
Betreff des Beitrags: Re: Prüfungsfrage zum Clustering Verfasst: 14.09.2014, 10:42 |
|
Versuchskaninchen |
|
|
Registriert: 26.04.2008, 08:28 Beiträge: 60
|
hallo, stelle mir grad genau die gleiche frage....hätte vielleicht jemand eine idee? wäre sehr nett lg
|
|
|
|
|
linnea
|
Betreff des Beitrags: Re: Prüfungsfrage zum Clustering Verfasst: 14.09.2014, 10:55 |
|
Mikroskopierer/in |
|
|
Registriert: 26.09.2012, 10:28 Beiträge: 185
|
Hallo Michael,
Ich weiß die Antwort leider auch nicht,würde aber gerne wissen, ob du weißt, wo die Lerneinheit 7 auf Bokulearn geblieben ist? Bzw wo kommt das Clustering sonst vor?
|
|
|
|
|
Alex S.
|
Betreff des Beitrags: Re: Prüfungsfrage zum Clustering Verfasst: 14.09.2014, 13:45 |
|
Versuchskaninchen |
|
|
Registriert: 15.11.2008, 10:35 Beiträge: 17
|
Hallo! Mach auch die Prüfung am 16.9.. Ich geb zu ich hab nur die 2012-Folien, aber da sollt sich nicht viel geändert haben. Es gibt einen Foliensatz dazu, allerdings fehlt mir ohne VO der Durchblick. Zu dieser Frage hab ich folgendes auf der Folie: The variables are measured on different scales, so we likely want to standardize the data before proceeding. > carsOrig <- cars[, -c(1, 2)] > dimnames(carsOrig)[[1]] <- cars$Car > medians <- apply(carsOrig, 2, median) > mads <- apply(carsOrig, 2, mad) > cars2use <- scale(carsOrig, center=medians, scale=mads) Welche grafischen/rechnerischen Unterschiede sich ergeben... sagen wir, es ist mir einfach egal. Ich hab mir bei der Ausarbeitung nur dazugeschreiben, dass die Werte zu standardisieren sind, um eine Vergleichbarkeit ohne Verzerrung zu schaffen. Kann auch falsch sein, da selbst aus den Fingern gesaugt.
|
|
|
|
|
Michaela
|
Betreff des Beitrags: Re: Prüfungsfrage zum Clustering Verfasst: 15.09.2014, 07:43 |
|
Versuchskaninchen |
|
|
Registriert: 26.04.2008, 08:28 Beiträge: 60
|
Hallo!
Danke für deine Antwort, Alex. Dann haben sich die Folien von 2012 auf 2013 anscheinend doch geändert, die Folien von 2013 beinhalten nämlich weniger zum Thema Clustering. Oder jedenfalls nicht genug, um die Prüfungsfrage mit den unterschiedlichen scales zu beantworten. Außerdem steht in den Prüfungsfragen noch was zum Thema "k-means clustering, was muss man vorher angeben". Steht auf deinen Folien dazu vielleicht auch etwas? Find auf den 2013er-Folien nur was zum Thema application to k-means clustering. @linnea: die Lerneinheit 7 betrifft Prof. Kreil, der von seinen Folien aber nix hochgeladen hat, daher wird sein Stoffgebiet lt. Prof. Oostenbrink auch nicht geprüft. Zum Clustering steht nur was in Lerneinheit 7, und das reicht, wie gesagt, auch net aus, um die Fragen zu beantworten.
LG Michaela
PS: Prof. Oostenbrink hat ja auch ein paar Example-Questions ins Netz gestellt. Wie würdet ihr Questions 6, Unterpunkt b) und d) (die Frage mit den repetitive sequences) beantworten? Ich war zwar damals in der VO, als er die Fragen besprochen hat, aber nachdem er so "langsam" spricht, hab ich nicht alles notieren können...
|
|
|
|
|
linnea
|
Betreff des Beitrags: Re: Prüfungsfrage zum Clustering Verfasst: 15.09.2014, 08:52 |
|
Mikroskopierer/in |
|
|
Registriert: 26.09.2012, 10:28 Beiträge: 185
|
Hallo!
Also, die k-means clustering Frage : Man muss die k-means zuvor per hand festlegen, entweder zufällig wählen und schaun was raus kommt, und dann anpassen oder zuvor in etwa berechnen. Hab ich aus dem Informatik Buch Xiong.
Repetetive sequencen , auch als low complexity regions bekannt, sind schlecht, weil sie zu viel zu vielen "false positives" führen können, weil kurze Sequenzen ja auch prinzipiell in anderen nicht verwandten Sequenzen gleich vorkommen können. Zu umgehen ist das ganze mit " soft" oder hard masking. Hard masking: Die low complexity regions ganz weglassen soft: bei der construction weglassen, aber für extension nützen.
Weißt du bei Frage 6, wieso ob die sekundäre Struktur eher schwer oder leicht zu vorhersagen ist?
|
|
|
|
|
Alex S.
|
Betreff des Beitrags: Re: Prüfungsfrage zum Clustering Verfasst: 15.09.2014, 09:14 |
|
Versuchskaninchen |
|
|
Registriert: 15.11.2008, 10:35 Beiträge: 17
|
Mach mir keine Angst, dass die 13er Folien anders sind! Ich konnte mich im moodle nämlich nur für 2012 und nicht für 2013 einschreiben... Durchkommen ist das Ziel, dafür wirds reichen! Im Forum gibts einen Thread, da hat jemand zu diesen Fragen eine ausführliche Ausarbeitung gepostet. Hab mir dort rausgeschrieben, eher schwer, mit ab initio (Chou Fasman) oder homology modeling. Mit ab initio ist die Vorhersage der beta-Strukturen schwer und für homology sind sie zu komplex. Wieder keine Garantie für Richtigkeit. Wünsche uns morgen einfache Standardfragen!
|
|
|
|
|
Michaela
|
Betreff des Beitrags: Re: Prüfungsfrage zum Clustering Verfasst: 15.09.2014, 10:36 |
|
Versuchskaninchen |
|
|
Registriert: 26.04.2008, 08:28 Beiträge: 60
|
@linnea: nein, das weiß ich leider auch nicht. übrigens: wir haben den prof. sykacek heute morgen per mail kontaktiert und ihn näher zum kapitel "clustering" und "scales" befragt (natürlich net auf die art, dass er glaubt, wir lernen bloß prüfungsfragen und sonst nix). ergebnis: diese fragen kommen nicht von ihm und das ist auch gar nicht sein stoffgebiet. das kapitel clustering kommt sonst noch im ludwig-teil vor, wo es um die konstruktionen von phylogenetischen bäumen geht. anscheinend muss also dieses kapitel mit der prüfungsfrage "clustering" gemeint sein...
lg
|
|
|
|
|
Michaela
|
Betreff des Beitrags: Re: Prüfungsfrage zum Clustering Verfasst: 15.09.2014, 10:41 |
|
Versuchskaninchen |
|
|
Registriert: 26.04.2008, 08:28 Beiträge: 60
|
PS: man könnte noch den prof. oostenbrink persönlich fragen, denn der stellt ja die fragen zusammen. allerdings ist das immer so eine sache...das soll dann ja net so enden, dass er dann anfängt völlig neue prüfungsfragen herzugeben..
|
|
|
|
|
linnea
|
Betreff des Beitrags: Re: Prüfungsfrage zum Clustering Verfasst: 15.09.2014, 11:36 |
|
Mikroskopierer/in |
|
|
Registriert: 26.09.2012, 10:28 Beiträge: 185
|
Vll habt ihr noch eine Antwort auf diese Frage: Two structures have differences at 20,30,45 AA and are determined experimentally. Relation to question " What methods can you use if no experimental structure is available"
|
|
|
|
|
Sabsl
|
Betreff des Beitrags: Re: Prüfungsfrage zum Clustering Verfasst: 16.09.2014, 09:36 |
|
Versuchskaninchen |
|
|
Registriert: 14.07.2008, 12:45 Beiträge: 86
|
Hallo, wär jemand von euch so nett, die Prüfungsfragen vom 16.9. zu posten? lg
|
|
|
|
|
linnea
|
Betreff des Beitrags: Re: Prüfungsfrage zum Clustering Verfasst: 16.09.2014, 14:00 |
|
Mikroskopierer/in |
|
|
Registriert: 26.09.2012, 10:28 Beiträge: 185
|
Es kamen keine neuen Prüfungsfragen. Für genauere Info im Prüfungsfragenkatalog nachsehen, aber so ungefähr
- 4 aa on surface + properties -beta sheet -secondayry structure -noch irgendwas
- origin of noise + implication on data analysis
- phylogenetische baum 3 taxa, -schritte zur konstruktion - newick format -wieso ist es so schwer, richtige bäume zu finden?
- vorteil von pssm -regular expression darstellung -multiple sequence alignment consensus sequence für eine pssm anschreiben
-2 experimentelle methoden um proteinstructure verhersagen -zwei computerbasierte -ein bild und 2 sequenzen mit unterschieden bei 20,30,45 aa noch irgendwas
|
|
|
|
|
|