On 05/11/13 11:56 AM, JC Grenier wrote: > Salut Sébastien, Hello/Bonjour,
(I cc'Ed the mailing list; you can subscribe at https://lists.sourceforge.net/lists/listinfo/denovoassembler-users ) > > Mon directeur m'a raconté que vous vous étiez rencontré à ASHG I attended #ASHG2013 on Twitter (if that counts), but I am afraid I was not in Boston during the American Society of Human Genetics 2013 meeting. Maybe it was someone from Laval University. > et m'a demandé de tester votre assembleur DeNovo. Tout >semble fonctionner. That's a good start it works for you. Are you using version 2.2.0 or 2.3.0 (new) ? > J'ai cependant quelques questions concernant l'assignation des contigs aux > espèces. Ray can assign contigs (or at least tell you what's there) with the -search option. > En fait, >j'ai premièrement fait l'assemblage et j'ai par la suite utiliser les >Scaffolds comme référence pour faire >un alignement de mes séquences. Est-ce une pratique respectable? Yes. I see people do that when they are looking for variants (SNPs and short insertions and deletions). > > Je cherche par la suite à assigner ces Scaffolds à une espèce. J'ai bien sûr > un seul regroupement de contig vers un scaffold. Le problème >est pour l'assignation des contigs vers les espèces. Certains contigs ont >plusieurs hits. Comment puis-je assigner sans ambiguité, >si c'est possible, ce contig à une espèce? It is not unusual to not be able to identify the true origin of a contig using alignments (or kmer matching if that matters). Perhaps this holds true particularly in metagenomics. > Je suppose que lorsque j'ai un scaffold ayant plusieurs contigs, je pourrais > essayer de trouver >le consensus entre les contigs... Je pourrais cependant avoir encore le même >problème. Sure. > > Dans le fichier ContigIdentifications.tsv, les trois dernères colonnes me > donnent les "matches" dans le contig. Que puis-je >dire sur un contig avec 3 matches sur une longueur de 900? > Ray (the "Ray Communities workflow presented in http://genomebiology.com/2012/13/12/R122 ) can give you a file named RayOutput/BiologicalAbundances/Name/ContigIdentifications.tsv where Name is the argument of the -search option. If you have only 3 matches out of 900 kmers for your contig, I would say that this does not mean anything. Perhaps you are working with a life form for which no known sequence is known. > Merci pour les précisions. You're welcome. > Bonne journée Seb > > -- > Jean-Christophe Grenier, M.Sc. > > ----------------------------------------- > /Bio-informaticien/ > /Laboratoire de Philip Awadalla/ > /Laboratoire de Luis Barreiro/ > /CHU Sainte-Justine/ > //3175, Côte Sainte-Catherine, local B-607 > ///Tél : 514-345-4931 poste 5199/ > ----------------------------------------- ------------------------------------------------------------------------------ November Webinars for C, C++, Fortran Developers Accelerate application performance with scalable programming models. Explore techniques for threading, error checking, porting, and tuning. Get the most from the latest Intel processors and coprocessors. See abstracts and register http://pubads.g.doubleclick.net/gampad/clk?id=60136231&iu=/4140/ostg.clktrk _______________________________________________ Denovoassembler-users mailing list [email protected] https://lists.sourceforge.net/lists/listinfo/denovoassembler-users
