Friday 15 September 2017

Architettura Di Algo Trading System


Architettura di sistema L'architettura di AlgoTrader è composto dai seguenti componenti. Il AlgoTrader Server fornisce l'infrastruttura per tutte le strategie in esecuzione su di esso. Il AlgoTrader Server tiene il motore principale Esper Complex Event Processing (CEP). E 'responsabile di tutti gli oggetti del modello di dominio e la loro persistenza nel database. Diversi adattatori dati di mercato sono a disposizione per elaborare i dati di mercato in tempo reale e storici. Sulle altre schede finali per diversi broker di esecuzione e gli scambi sono disponibili, che sono responsabili per l'immissione degli ordini e la ricezione di esecuzioni. Il AlgoTrader Server fornisce anche componenti di business per la gestione del portafoglio, misurazione delle performance, gestione del rischio, gestione del denaro, di valutazione delle opzioni, la riconciliazione, la copertura Forex e ottimizzazione dei parametri. In cima alla AlgoTrader Server qualsiasi numero di strategie può essere distribuito. AlgoTrader ha un'architettura event driven utilizzando un motore CEP Esper dedicata per la strategia. Una strategia può implementare un numero qualsiasi di dichiarazioni Esper SQL-like di analisi e di segnali dati di mercato generazione basati sul tempo. dichiarazioni Esper possono invocare qualsiasi numero di azioni procedurali, come ad esempio un ordine o la chiusura di una posizione, che sono codificati in Java. La combinazione di dichiarazioni Esper e il codice Java fornisce un approccio best-of-entrambi i mondi. Per la gestione ed il monitoraggio del sistema esistono quattro differenti client GUI. Il nuovo AlgoTrader HTML5 Frontend fornisce negoziazione funzionalità correlate come la creazione di grafici, ordini, posiziona i dati di mercato amp. Il cliente AlgoTrader Eclipse è l'ambiente di sviluppo di strategia di default. Il cliente EsperHQ gestisce il motore di Esper CEP. Il cliente Grails è un client generico per la gestione dei dati di riferimento. Per gli impianti produttivi e di distribuzione AlgoTrader utilizza Docker. AlgoTrader 3.1 integra InfluxDB gen-20-2017 AlgoTrader integra InfluxDB per la memorizzazione dei dati di mercato in tempo reale e storici. Con InfluxDB miliardi di zecche possono essere memorizzati e utilizzati per il test di nuovo. L'introduzione di AlgoTrader 3.0 8211 la più potente AlgoTrader Eppure Apr-07-2016 AlgoTrader 3.0 è stato rilasciato. Questa versione include il nuovo HTML5 Frontend, distribuzione one-click con Docker, tre nuovi algoritmi di esecuzione e di un Excel basato Indietro Test Report Introducendo AlgoTrader One-Click Installazione da Docker Mar-15-2016 AlgoTrader 3.0 introduce le installazioni strategia di trading con un clic alimentati da docker AlgoTrader Condizioni di Licenza I TERMINI E LE CONDIZIONI DEL PRESENTE CONTRATTO DI LICENZA PER L'UTENTE (8220AGREEMENT8221) regolano l'uso del il software è e il licenziante hanno eseguito un SEPARATA contratto scritto di licenza che regola l'uso DEL SOFTWARE. Il licenziante è disposto a concedere in licenza il Software solamente a condizione di accettare tutti i termini contenuti nel presente accordo. Con la firma di questo accordo o scaricando, installando o utilizzando il Software, è stato indicato che si capisce questo accordo e accettare tutti i suoi termini. Se non si accettano tutti i termini del presente accordo, allora il Licenziante non è disposta a concedere in licenza il software a te, e non si può scaricare, installare o utilizzare il Software. 1. CONCESSIONE DI LICENZA a. Scopo di valutazione e sviluppo Licenza d'uso. Fatto salvo il vostro rispetto dei termini e condizioni del presente accordo, le Licenziante concede all'utente una, non esclusiva, della licenza personale e non trasferibile, senza diritto di sublicenza, per la durata del presente accordo, internamente utilizzare il Software esclusivamente per valutazione uso e lo sviluppo Usa. prodotti software di terze parti o moduli forniti dal licenziante, se del caso, possono essere utilizzati esclusivamente con il software, e può essere soggetto all'accettazione dei termini e delle condizioni previste da tali terzi. Quando la licenza termina è necessario interrompere l'utilizzo del Software e disinstallare tutte le istanze. Tutti i diritti non espressamente concessi all'utente nel presente documento sono mantenuti dal Licenziante. Sviluppatore deve fare alcun uso commerciale del software, o qualsiasi lavoro derivato (anche per Developer8217s scopi commerciali interni). La copia e la ridistribuzione, in qualsiasi forma, è vietata la Software o sviluppatori di applicazioni per i clienti diretti o indiretti. b. Produzione Licenza d'uso. Fatto salvo il vostro rispetto dei termini e condizioni del presente accordo, compresi il pagamento del canone del caso, i Licenziante concede a voi una licenza non esclusiva e non trasferibile, senza il diritto di concedere in licenza, per la durata del presente accordo, per : (a) utilizzare e riprodurre il Software esclusivamente per i propri scopi interni aziendali (8220Production Use8221) e (b) effettuare un numero ragionevole di copie del Software esclusivamente per fini di backup. Tale licenza è limitata al numero specifico di CPU (se concesso in licenza da CPU) o le istanze di macchine virtuali Java (se le licenze di macchina virtuale) per cui si è pagato un canone. L'uso del Software su un maggior numero di CPU o istanze di Java Virtual Machine richiederà il pagamento di un supplemento di licenza. prodotti software di terze parti o moduli forniti dal licenziante, se del caso, possono essere utilizzati esclusivamente con il software. c. Nessun altro diritto. I diritti in, e di fare uso di, il Software sono limitate a quelle espressamente concessi nella presente sezione 1. Si farà nessun altro uso del Software. Fatto salvo quanto espressamente autorizzato in questa sezione, il Concedente concede nessun altro diritto o licenza, per implicazione, preclusione o altro. Tutti i diritti non espressamente concessi sono riservati dal Cedente OI SUOI ​​FORNITORI. 2. LIMITAZIONI Salvo quanto espressamente previsto nella Sezione 1, non sarà possibile: (a) modificare, tradurre, disassemblare, creare lavori derivati ​​del Software o copiare il software (B) affittare, prestare, trasferire, distribuire o concedere alcun diritto in Software in qualsiasi forma a qualsiasi persona (c) fornire, comunicare, divulgare o mettere a disposizione, o permettere l'uso del Software, da parte di terzi (d) pubblicare qualsiasi test di benchmark o di prestazioni eseguiti sul Software o parte di esso o ( e) rimuovere avvisi, etichette o marcature sul Software. Non sarà distribuire il Software a qualsiasi persona su base standalone o su una base produttore di apparecchiature originali (OEM). 3. PROPRIETÀ Come tra le parti, il Software è e resterà l'unica ed esclusiva proprietà del Licenziante, inclusi tutti i diritti di proprietà intellettuale. un. Nel caso in cui si utilizza il software sotto la licenza di cui alla sezione 1 (a), il presente accordo resterà in vigore per tutta la durata del periodo di valutazione o di sviluppo. b. Nel caso in cui si utilizza il software sotto la licenza di cui alla sezione 1 (b) del presente Accordo rimarrà in vigore (a) per la durata di un anno, se acquistata come una licenza di abbonamento annuale o (b) perennemente se acquistato come licenza perpetua. Una licenza di abbonamento annuale verrà automaticamente rinnovato di un anno se non è terminato con uno mese preavviso. Questo accordo terminerà automaticamente senza preavviso in caso di violazione di qualsiasi termine di questo Accordo. In caso di risoluzione, è necessario immediatamente cessare di utilizzare il Software e distruggere tutte le copie del Software in suo possesso o controllo. 5. SERVIZI DI ASSISTENZA Se avete acquistato questa licenza, compresi i servizi di supporto questi includono Uscite di manutenzione (aggiornamenti e upgrade), supporto telefonico ed e-mail o supporto web-based. un. Il licenziante farà tutti gli sforzi commercialmente ragionevoli per fornire un aggiornamento progettato per risolvere o by-pass di un errore riportato. Se tale errore è stato corretto in una Maintenance Release, il licenziatario deve installare e implementare il Maintenance Release applicabile in caso contrario, l'aggiornamento può essere fornita sotto forma di una soluzione temporanea, procedura o di routine, ad essere utilizzati fino una release di manutenzione contenente l'aggiornamento permanente è disponibile. b. Durante la durata del contratto di licenza, il concedente deve fare manutenzione release disponibili al Licenziatario se, come e quando il Licenziante rende tali Uscite di manutenzione generalmente a disposizione dei suoi clienti. Se si pone una domanda sul fatto un'offerta di prodotto è un aggiornamento o di un nuovo prodotto o funzione, il parere Licensor8217s prevarrà, a condizione che il licenziante tratta l'offerta di prodotti come un nuovo prodotto o funzionalità per i propri clienti finali in genere. c. L'obbligo Licensor8217s per fornire servizi di supporto è subordinato il seguente: (a) il Licenziatario faccia ragionevoli sforzi per correggere l'errore dopo aver consultato con il licenziante (b) licenziatario fornisce al Concedente con informazioni e risorse sufficienti per correggere l'errore sia sul sito Licensor8217s o tramite accesso remoto al sito Licensee8217s, così come l'accesso al personale, hardware e software aggiuntivi coinvolti nella scoperta Errore (c) il licenziatario installa tempestivamente tutte le versioni di manutenzione e (d) procura licenziatario, installa e mantiene tutte le attrezzature, comunicazione interfacce e altro hardware necessari per utilizzare il prodotto. d. Il Licenziante non è obbligata a fornire servizi di supporto nelle seguenti situazioni: (a) il prodotto è stato modificato, modificati o danneggiati (a meno che sotto la supervisione diretta del Concedente) (b) l'errore è causato da Licensee8217s negligenza, malfunzionamenti hardware o altre cause al di là del ragionevole controllo del Concedente (c) l'errore è causato da software di terze parti non distribuito attraverso il (d) il licenziatario licenziante non ha installato e implementato manutenzione di uscita (s) in modo che il prodotto è una versione supportata dal licenziante o (e) il licenziatario non ha pagato i canoni o tasse di servizi di supporto alla scadenza. Inoltre il Concedente non è obbligata a fornire servizi di supporto per il codice software scritto dal cliente stesso sulla base del Prodotto. e. Il Licenziante si riserva il diritto di interrompere i servizi di supporto in caso di Licenziante, a sua esclusiva discrezione, stabilire che continuo supporto per qualsiasi prodotto non è più economicamente praticabile. Il licenziante darà licenziatario di almeno tre preavviso (3) mesi prima scritta di tale interruzione dei servizi di supporto e rimborserà alcun supporto tasse Servizi licenziatario non-maturato può aver prepagata rispetto al prodotto interessato. Il Licenziante non ha alcun obbligo di sostenere o mantenere qualsiasi versione di piattaforme di terze parti sottostanti (incluso ma non limitato al software, JVM, sistema operativo o hardware) per i quali il prodotto è supportato tranne (i) la versione corrente del prodotto o prodotto e la piattaforma di terze parti di base, e (ii) le due versioni immediatamente precedenti del sistema operativo del prodotto e per un periodo di sei (6) mesi dopo la prima superata. Il Licenziante si riserva il diritto di sospendere l'esecuzione dei servizi di supporto, se il Licenziatario non riesce a pagare qualsiasi importo erogabile al Licenziante ai sensi del Contratto entro trenta (30) giorni dopo tale importo è esigibile. 6. GARANZIA a. I warrant Licenziante che il Software sarà in grado di eseguire in tutti gli aspetti rilevanti in conformità con le specifiche funzionali esposte nella documentazione applicabile per un periodo di 90 giorni dopo la data in cui si installa il software. In caso di violazione di tale garanzia, il Licenziante, a sua discrezione, correggere il Software o sostituire tale software gratuitamente. Quanto sopra sono i tuoi unici ed esclusivi rimedi e la Licensor8217s unico responsabile per la violazione di queste garanzie. Le garanzie di cui sopra sono fatte da e per il beneficio di tuo. Le garanzie si applicano solo se (a) il Software è stato correttamente installato e utilizzato in ogni momento e in conformità con le istruzioni per l'uso (c) gli aggiornamenti più recenti sono stati applicati al software e (c) nessuna modifica, variazione o aggiunta è stato fatto per il Software da parte di persone diverse dal licenziante o del Licensor8217s mandatario. 7. ESCLUSIONE SALVO QUANTO potrebbero essere incluse nelle SEZIONE 6 (a), il concedente ESPRESSAMENTE TUTTE LE GARANZIE, ESPRESSE O IMPLICITE, COMPRESE TUTTE LE GARANZIE DI COMMERCIABILITÀ, IDONEITÀ PER UN PARTICOLARE SCOPO E NON VIOLAZIONE E GARANZIE DERIVANTI DA TRATTATIVA O USI DI COMMERCIO. NESSUN CONSIGLIO O INFORMAZIONE, ORALE O SCRITTA, OTTENUTO DAL LICENZIANTE O ALTROVE SARANNO UNA GARANZIA NON ESPRESSAMENTE IN QUESTO CONTRATTO. Il Licenziante non fornisce alcuna garanzia che il Prodotto Software soddisferà le vostre esigenze o operano sotto le specifiche condizioni d'uso. Il Licenziante non garantisce che il funzionamento del Prodotto Software sarà sicuro, privo di errori, o privo di interruzioni. È necessario determinare se il prodotto software soddisfi SUFFICIENTEMENTE I REQUISITI PER LA SICUREZZA E UNINTERRUPTABILITY. Ti assumi la responsabilità UNICO ED OGNI RESPONSABILITÀ PER eventuali perdite subite a causa di avaria PRODOTTO SOFTWARE per soddisfare i requisiti. IL LICENZIANTE NON, in nessuna circostanza, essere ritenuta responsabile per la perdita di dati su qualsiasi computer o dispositivo INFORMAZIONI SULLO STOCCAGGIO. 8. Limitazione di responsabilità Il LICENSOR8217S RESPONSABILITÀ TOTALE PER VOI DA TUTTE LE CAUSE DI AZIONE E IN TUTTE LE TEORIE DI RESPONSABILITÀ SARÀ LIMITATA ALLA e non supererà il canone DALL'UTENTE al licenziante PER IL SOFTWARE. IN NESSUN CASO IL LICENZIANTE ESSERE RESPONSABILE PER QUALSIASI, ACCIDENTALI, ESEMPLARI, PUNITIVI O CONSEGUENTI SPECIALI (INCLUSI PERDITA DI UTILIZZO, DATI, AFFARI O PROFITTI) O PER IL COSTO DEI PRODOTTI SOSTITUTIVI procurare DERIVANTI DA O IN RELAZIONE AL PRESENTE CONTRATTO O L'UTILIZZO O L'ESECUZIONE DEL SOFTWARE, ANCHE QUANDO LE RESPONSABILITA 'nasce da EVENTUALI RICHIESTE SULLA BASE CONTRATTO, GARANZIA, ILLECITO (INCLUSA LA NEGLIGENZA), RESPONSABILITÀ OGGETTIVA O ALTRO, E SE LA LICENZIANTE SIANO STATI INFORMATI DELLA POSSIBILITA' DI TALI PERDITE O DANNO. Tali limitazioni si sopravvivere e APPLICABILE ANCHE QUALORA IL RIMEDIO LIMITATO specificate nel presente contratto si trova ad avere FALLITO IL SUO SCOPO ESSENZIALE. NELLA MISURA IN CUI LA GIURISDIZIONE APPLICABILE limita la capacità di rinunciare ad ogni LICENSOR8217S GARANZIE, QUESTO dichiarazione è efficace nella misura massima consentita. 9. GENERALI Se una qualsiasi disposizione del presente accordo è ritenuta non valida o inapplicabile, il resto del presente accordo rimarrà in vigore a tutti gli effetti. Nella misura in cui qualsiasi restrizione espressa o implicita non sono consentiti dalle leggi applicabili, queste restrizioni esplicite o implicite restano in vigore ed effetto nella misura massima consentita da tali leggi vigenti. Questo accordo è l'accordo completo ed esclusivo tra le parti in relazione alla materia oggetto del presente documento, superando e sostituendo qualsiasi e tutti i precedenti accordi, le comunicazioni e le intese (sia scritta che orale) per quanto riguarda tale materia in oggetto. Le parti del presente accordo sono contraenti indipendenti, e non ha né il potere di legare l'altro o di incorrere in obblighi per conto other8217s. Nessun guasto di una delle parti di esercitare o far rispettare i propri diritti nell'ambito del presente accordo agirà come una rinuncia a tali diritti. Eventuali termini e le condizioni contenuti in qualsiasi ordine di acquisto o altro documento d'ordine che sono incompatibili con o in aggiunta ai termini e alle condizioni del presente accordo sono respinte dal licenziante e sarà considerata nulla e di nessun effetto. Il presente Contratto sarà interpretato e interpretato in conformità con le leggi della Svizzera, senza tener conto dei principi di legge. Le parti acconsentono alla giurisdizione esclusiva dei tribunali situati a Zurigo, Svizzera per la risoluzione di eventuali controversie derivanti da o relative al presente accordo. 10. DEFINIZIONI 8220Evaluation Use8221 significa uso del Software esclusivamente per la valutazione e il processo per le nuove applicazioni destinate alla vostra produzione Usa. 8220Production Use8221 significa utilizzare il software solo per scopi di business interno. Produzione Usa non include il diritto di riprodurre il software per la subconcessione, la rivendita, o la distribuzione, compresi, senza limitazione, il funzionamento su una condivisione di tempo o distribuire il software come parte di un ASP, VAR, OEM, distributore o rivenditore disposizione. 8220Software8221 significa che il software Licensor8217s e tutti i suoi componenti, la documentazione e gli esempi inclusi dal Concedente. 8220Error8221 significa o (a) un guasto del Prodotto conforme alle specifiche indicate nella documentazione, con la conseguente impossibilità di utilizzare, o restrizioni nell'uso del, Prodotto, Andor (b) un problema che richiede nuove procedure, chiarimenti , informazioni supplementari richieste eo di miglioramenti di prodotto. 8220Maintenance Release8221 significa Upgrade e aggiornamenti per il prodotto che vengono resi disponibili ai licenziatari di cui ai Servizi di supporto standard definiti nella sezione 5. 8220Update8221 indica sia una modifica software o aggiunta che, quando fatto o aggiunto al prodotto, corregge l'errore, o di un procedura o di routine che, se osservato nel regolare funzionamento del prodotto, elimina l'effetto negativo pratica dell'errore sul licenziatario. 8220Upgrade8221 significa una revisione del prodotto rilasciato dal Licenziante ai propri clienti finali in genere, durante il Support Services Term, per aggiungere funzioni nuove e diverse o per aumentare la capacità del prodotto. Aggiornamento non include il rilascio di un nuovo prodotto o funzionalità aggiuntive per le quali ci può essere un separato sistema di Architettura charge. Algorithmic Trading precedenza su questo blog ho scritto circa l'architettura concettuale di un sistema di trading algoritmico intelligente così come il funzionale e non requisiti ognitempo di un sistema di trading algoritmico di produzione. Da allora ho progettato un'architettura di sistema che credo potrebbe soddisfare queste esigenze architettoniche. In questo post mi limiterò a descrivere l'architettura seguendo le linee guida dei ISOIECIEEE 42010 sistemi e ingegneria del software dell'architettura descrizione standard. Secondo questa norma una descrizione architettura deve: contenere più vedute architettoniche standardizzati (ad esempio in UML) e mantenere la tracciabilità tra le decisioni di design e di architettura requisiti software definizione dell'architettura vi è ancora consenso riguardo a ciò che una architettura di sistemi è. Nel contesto di questo articolo, esso è definito come l'infrastruttura all'interno della quale è possibile specificare i componenti delle applicazioni che soddisfano i requisiti funzionali, dispiegati, ed eseguite. Requisiti funzionali sono le funzioni previste del sistema e dei suoi componenti. requisiti non funzionali sono misure attraverso cui la qualità del sistema può essere misurato. Un sistema che soddisfa pienamente le esigenze funzionali potrebbe ancora non riescono a soddisfare le aspettative se i requisiti non funzionali sono lasciati insoddisfatti. Per illustrare questo concetto consideri il seguente scenario: un sistema di trading algoritmico che avete appena acquistato costruito rende decisioni commerciali eccellenti, ma è del tutto inutilizzabile con la gestione del rischio di organizzazioni e sistemi di contabilità. Sarebbe questo sistema soddisferà le vostre aspettative architettura concettuale Una visione concettuale sono descritti i concetti di alto livello e meccanismi che esistono nel sistema al più alto livello di granularità. A questo livello, il sistema di trading algoritmico segue un'architettura event driven (EDA) suddiviso in quattro livelli, e due aspetti architettonici. Per ogni architetture e modelli di riferimento di livello e aspetto sono utilizzati. modelli architettonici sono dimostrati, strutture generiche per il raggiungimento di specifici requisiti. aspetti architettonici sono preoccupazioni trasversali che si estendono su più componenti. Event Driven Architecture - un'architettura che produce, rileva, consuma, e reagisce agli eventi. Gli eventi includono i movimenti in tempo reale di mercato, eventi complessi o le tendenze ed eventi commerciali ad esempio presentazione di un ordine. Questo diagramma illustra l'architettura concettuale delle architetture algoritmiche sistema commerciale di riferimento Per usare un'analogia, una architettura di riferimento è simile ai modelli per un muro portante. Questo blu-stampa può essere riutilizzato per la costruzione di disegni multipli indipendentemente da ciò che si sta edificio costruito come soddisfa una serie di requisiti che si verificano comunemente. Analogamente, una architettura di riferimento definisce un modello contenente strutture e meccanismi che possono essere utilizzati per costruire una architettura software cemento che soddisfa requisiti specifici generici. L'architettura del sistema di trading algoritmico utilizza un'architettura basata spazio (SBA) e un controllore vista del modello (MVC) come riferimenti. sono utilizzati anche buone pratiche come l'archivio dei dati operativi (ODS), l'estratto di trasformazione e caricamento modello (ETL), e un data warehouse (DW). Model View Controller - un modello che separa la rappresentazione delle informazioni dall'interazione utenti con esso. Spazio architettura basata - specifica una infrastruttura in cui le unità di elaborazione debolmente accoppiati interagiscono tra loro attraverso una memoria associativa condivisa denominata spazio (vedi sotto). Vista strutturale La vista strutturale un'architettura mostra i componenti e sotto-componenti del sistema di trading algoritmico. Essa mostra anche come questi componenti vengono distribuiti su infrastrutture fisiche. I diagrammi UML utilizzati in questa prospettiva includono diagrammi di componenti e diagrammi di distribuzione. Qui di seguito è la galleria dei diagrammi di implementazione del sistema di trading algoritmico generale e le unità di elaborazione della architettura di riferimento SBA, nonché relativi diagrammi di componenti per ciascuno degli strati. Tattiche architettonici Secondo l'istituto di ingegneria del software una tattica di architettura è un mezzo per soddisfare un requisito di qualità manipolando alcuni aspetti di un modello di attributo di qualità attraverso decisioni di progettazione architettonica. Un semplice esempio utilizzato nel architettura di sistema trading algoritmico sta manipolando un archivio dati operativi (ODS), con una componente di interrogazione continuo. Questo componente potrebbe analizzare continuamente il ODS per identificare ed estrarre eventi complessi. Le seguenti tattiche sono utilizzati nell'architettura: Il modello distruttore nelle code di eventi e di ordine di memoria per il code eventi e ordinare linguaggio di query continuo (CQL) condivise sulla filtraggio ODS dati con il modello di progettazione filtro su algoritmi di data evitare la congestione in arrivo su tutti le connessioni in entrata e in uscita gestione attiva della coda (AQM) e Congestion Notification risorse Commodity informatiche espliciti con una capacità di aggiornamento (scalabile) di ridondanza attivo per tutti i singoli punti di guasto indicizzazione e strutture di persistenza ottimizzate nei ODS programma di backup regolare dei dati e gli script di pulizia per storie di transazione ODS su tutti i database checksum per tutti gli ordini per rilevare i guasti Annota eventi con data e ora di saltare eventi stantii Ordinare le regole di convalida per esempio quantità commerciali massimi automatizzati componenti commerciante utilizzare un database in-memory per l'autenticazione analisi a due stadi per le interfacce utente che si connette alla ATS crittografia sulle interfacce utente e le connessioni con il modello di progettazione AT Observer per il MVC per la gestione di vista che questo elenco sono solo un disegno alcuni decisioni che ho identificato durante la progettazione dell'architettura. Non è un elenco completo di tattiche. Come è stato sviluppato il sistema di tattiche supplementari dovrebbero essere impiegati su più livelli di granularità per soddisfare i requisiti funzionali e non funzionali. Qui di seguito sono tre diagrammi che descrivono il modello distruttore disegno, modello di progettazione del filtro, e il componente di interrogazione continuo. Comportamentale Questa vista di un'architettura mostra come i componenti e strati devono interagire tra loro. Questo è utile quando si creano scenari per testare l'architettura disegni e per la comprensione del sistema da end-to-end. Questo punto di vista è costituito da diagrammi di sequenza e diagrammi di attività. diagrammi di attività mostrano i sistemi di trading algoritmico processo interno e come si suppone agli operatori di interagire con il sistema di trading algoritmico sono riportati di seguito. Tecnologie e framework Il passo finale nella progettazione di un'architettura software è quello di identificare potenziali tecnologie e strutture che potrebbero essere utilizzate per realizzare l'architettura. Come principio generale è meglio per sfruttare al largo delle tecnologie esistenti, a condizione che soddisfino i requisiti in modo adeguato sia funzionali e non funzionali. Un quadro è una architettura di riferimento per esempio realizzato JBoss è un framework che realizza l'architettura di riferimento JEE. Le seguenti tecnologie e framework sono interessanti e dovrebbero essere considerati in sede di attuazione di un sistema di trading algoritmico: CUDA - NVIDIA ha una serie di prodotti che supportano la modellazione finanza computazionale ad alte prestazioni. Si può raggiungere fino a 50x miglioramenti delle prestazioni nella gestione di simulazioni Monte Carlo sulla GPU anziché dalla CPU. Apache River - Fiume è un kit utilizzato per sviluppare sistemi distribuiti. E 'stato utilizzato come quadro per applicazioni edili basate sul modello SBA Apache Hadoop - nel caso in cui la registrazione diffusa è un requisito, quindi l'uso di Hadoop offre una soluzione interessante al problema big-dati. Hadoop può essere implementato in un ambiente cluster di supporto delle tecnologie CUDA. AlgoTrader - una piattaforma di trading algoritmico open source. AlgoTrader potrebbe potenzialmente essere schierato al posto dei componenti automatici commerciante. FIX Engine - una applicazione stand-alone che supporta i protocolli Financial Information Exchange (FIX) compresi FIX, veloce e FIXatdl. Pur non essendo una tecnologia o un quadro, i componenti dovrebbero essere costruiti con un'interfaccia di programmazione delle applicazioni (API) per migliorare l'interoperabilità del sistema e dei suoi componenti. Conclusione L'architettura proposta è stata progettata per soddisfare le esigenze molto generiche individuate per i sistemi di trading algoritmico. In generale i sistemi di trading algoritmico sono complicati da tre fattori che variano con ogni implementazione: Dipendenze sui sistemi di scambio di impresa esterna e stimolante requisiti non funzionali e in continua evoluzione vincoli architettonici L'architettura software proposto sarebbe quindi bisogno di essere adattato caso per caso, al fine per soddisfare i requisiti normativi ed organizzativi specifici, nonché di superare le limitazioni regionali. L'architettura del sistema di trading algoritmico dovrebbe essere visto solo come un punto di riferimento per gli individui e le organizzazioni che vogliono progettare i propri sistemi di trading algoritmico. Per una copia completa e fonti utilizzate si prega di scaricare una copia del mio rapporto. Grazie you. There sono in realtà solo 3 blocchi principali di un sistema di trading Algo. 1. Dati di mercato Handler (ad esempio VELOCE gestore) 2. Strategia modulo (ad esempio la strategia crossover) 3. Order Router (ad esempio router FIX) è possibile aggiungere i controlli di rischio sia nella strategia modulo o il modulo router Ordine o entrambi. Finché il flusso di dati sono corretti, si dovrebbe essere a posto. Ricorda che sta progettando un ATS per latenza minima, e l'aggiunta di più livelli o la complessità arriverà a costo di latenza. architettura ATS minimo e se si aggiungono le campane e fischietti, sarebbe simile al seguente: Se siete interessati al nocciolo della implementazione dell'architettura sopra anche, si dovrebbe tenere le seguenti cose in mente. Evitare locksmutexes. Nel caso in cui si deve utilizzare, provate la loro sostituzione con strutture lockless utilizzando Atomics. Ci sono un paio di librerie disponibili per strutture di dati lockless (ad esempio libcds, kit per la concorrenza ecc). C-11 supporta std :: atomica. e si dovrebbe cercare di usare loro. Evitare di che cosa è fatto in QuickFIX. Il suo scritto per safetyflexibilityreusability come oggetto (blocco) creazione e distruzione è fatto per ogni invocazione di qualsiasi messaggio al router. Sicuramente non c'è modo di scrivere un codice sensibile alla latenza. No allocazione di memoria di runtime. percorso runtime dovrebbe usare la gestione della memoria personalizzata e senza serratura con pool di memoria pre-assegnati. Tutto l'inizializzazione può essere realizzata in costruttori. Accoppiamento stretto. Threading modello, il modello IO e la gestione della memoria devono essere progettati per collaborare tra loro per ottenere migliori prestazioni complessive. Questo va contro il concetto OOP di accoppiamento lasco, ma la sua necessaria per evitare il costo di esecuzione di polimorfismo dinamico. Utilizzare i modelli. Allo stesso modo, vorrei anche suggerire si guardano C templatization per raggiungere la flessibilità di codice. Ottimizzazione OSHardware: Infine, si dovrebbe cercare di lavorare con Linux Kernel RT e scheda di rete Solarflare con autista OpenOnLoad per il raggiungimento di latenza minima. si può ulteriormente cercare di isolare la CPU ed eseguire il programma su quel particolare nucleo. E infine l'API pubblica che si avrebbe bisogno di esporre agli sviluppatori di strategia. Vorrei che questo sia il set minimo che incapsulare tutta la complessità di quel particolare exchangedestination. Classe OrderRouter pubblico: bool sendNewOrd virtuale (Orderinfo) 0 virtuale bool sendRplOrd (Orderinfo) 0 virtuale bool sendCxlOrd (Orderinfo) 0 virtualBut questo significa che la classe Orderinfo ha bisogno di avere tutti i dettagli richiesti dal destinationexchange. In generale, gli scambi richiede lo stesso tipo di informazioni, ma come si va avanti e il supporto più exchangesdestinations si dovrebbe trovare te stesso aggiungendo più variabili in questa classe. I seguenti sono i questionschallenges importanti si avrebbe bisogno di chiedere a te stesso: 1. architettura multi-processo o l'architettura multi-thread. se per costruire un processo monolitico con più thread, o scrivere diversi processi. Il costo del processo multiplo è messaggio passando latenza, mentre il costo per i molteplici filettato singolo processo è che qualsiasi errore può far cadere l'intero sistema. 2. Message Passing: mentre è possibile scegliere tra pletora di opzioni, si sono limitati dalla considerazione latenza. Il più veloce IPC sarebbe la memoria dinamica, ma allora come si farebbe la sincronizzazione trascorrere del tempo con queste due domande perché sarebbero l'elemento su cui l'architettura si trova. Edit: FIX e FAST Per quanto riguarda il protocollo popularstandard, FIX consente di inviare ordini e FAST è per i dati di mercato. Detto questo, la maggior parte degli scambi hanno un proprio protocollo nativo, che è più veloce di FIX, perché FIX è generalmente implementato in cima alla loro protocollo nativo. Ma loro continuano a sostenere FIX si aggiunge alla velocità di implementazione. D'altra parte, mentre il FIX è adottato dalla maggior parte degli scambi, VELOCE non gode tale accettazione larga. Se non altro, ci sarebbe solo una manciata di scambio adozione. La maggior parte di loro sia inviare più di fissarsi (bassa latenza), o utilizzare il proprio protocollo binario nativo. per esempio. In India, NSE, BSE e MCXMCXSX, tutti e tre gli scambi ti dà correzione protocollo oltre al protocollo nativo, ma solo la BSE garantisce un modo rapido per i dati di mercato. E questo è anche muovendo da veloce a nativa con l'introduzione di EOBI. è possibile estrapolare la stessa cosa ad altri scambi. 3.9k Visualizzazioni middot View upvotes middot Not for Reproduction Come John accennato, OMS è il punto cruciale di qualsiasi piattaforma di trading e si dovrebbe iniziare dalla ricerca su di esso. Si dovrebbe trascorrere del tempo per determinare i ciclo di vita commerciale, gli eventi e le funzionalità che si desidera incorporare sul OMS e quelli che si desidera la vostra Algo motore da gestire. Metcetera offre una OMS open source, ho haven039t usato personalmente ma it039s uno dei pochi sul mercato. La prossima cosa che si dovrebbe guardare è fornire un'interfaccia per dati di origine e spingerlo fuori. Si tratta di un sistema di registrazione degli ordini cliente per gettare i dettagli dell'ordine e il motore Algo alla fonte esso. Un sacco di OMS039s lato delle vendite utilizzare una combinazione di programmi proprietari scritti in JavaC utilizzando FIX. protocollo FIX permette di comunicare in tempo reale attraverso i sistemi in un amplificatore semplificata formato di messaggio predefinito stabilito dalla comunità protocollo FIX. Vai a Il FIX protocollo Organizzazione GT Home page per leggere di più su di esso. esamina anche Open Source Engine FIX. un'implementazione open source del motore FIX. Segue una interfaccia dati di mercato per fonte di tempo in tempo reale informazioni di mercato della sicurezza, i dati che vanno dal HighLowOpenClose Best BidBest Chiedi, il volume totale scambiato, ultimo prezzo, ultimo volume, Bid cita, Chiedi preventivi ecc Le informazioni che cercate in realtà dipende dal tipo di strategia che si vuole implementare. Credo Interactive Broker fornisce un feed di dati in tempo reale tramite FIX. connettività di Exchange è il prossimo in cui il vostro Algo interpreta i segnali, creare un ordine e percorsi di scambio o di ECN. Lo sviluppo in-house potrebbe essere duro come si avrebbe bisogno di lavorare fuori appartenenza Exchange, certificare la propria piattaforma e pagare una quota di adesione regolare. Un modo più economico è quello di utilizzare una API mediatore (come IB) e percorso l'ordine attraverso di loro. I dati storici è di essenza troppo, come si potrebbe desiderare di confrontare il comportamento attuale del mercato con i suoi valori storici. Parametri come spread medio, profili VWAP, media ecc volume giornaliero può essere richiesto per influenzare il processo decisionale. Si può avere il database (preferito), ma se la velocità dell'essenza poi scaricare sul cache del server quando si inizia il programma. Una volta che i sistemi periferici sono messa a punto, è possibile iniziare a sviluppare il programma di algo nel modo desiderato farlo funzionare. Questa infrastruttura di base permetterebbe di inserire un ordine algo genitore, leggere i dati di mercato, reagire ai segnali, ma la generazione di ordini minori e l'immissione sul portafoglio ordini e lo scambio di dati storici di influenzare il processo decisionale. L'OMS tiene il collegamento tra l'ordine bambino genitore amp, loro status in tempo reale e aggiornamenti dalla piattaforma algo o la connettività di scambio. Che cosa si vuole implementare all'interno del Algo è completamente a voi. 2.3K Visualizzazioni middot View upvotes middot non per ReproductionBest linguaggio di programmazione per Algorithmic Trading Systems Una delle domande più frequenti che ricevo nel raccoglitore QS è Qual è il miglior linguaggio di programmazione per il trading algoritmico. La risposta breve è che non esiste un linguaggio migliore. parametri di strategia, le prestazioni, la modularità, lo sviluppo, la resilienza e il costo devono tutti essere presi in considerazione. Questo articolo illustrerà i componenti necessari di un'architettura di sistema trading algoritmico e come le decisioni relative all'attuazione influenzare la scelta della lingua. In primo luogo, saranno prese in considerazione le principali componenti di un sistema di trading algoritmico, come ad esempio gli strumenti di ricerca, portafoglio ottimizzatore, risk manager e motore di esecuzione. Successivamente, diverse strategie di trading saranno esaminate e come influenzano la progettazione del sistema. In particolare, saranno entrambi discussa la frequenza degli scambi e il volume degli scambi probabile. Una volta selezionata la strategia di negoziazione, è necessario architetto dell'intero sistema. Ciò include la scelta di hardware, il sistema operativo (s) e la resilienza sistema contro eventi rari e potenzialmente catastrofici. Mentre l'architettura viene presa in considerazione, tenendo conto deve essere pagato per le prestazioni - sia per gli strumenti di ricerca, nonché l'ambiente di esecuzione dal vivo. Qual è il sistema commerciale cercando di fare prima di decidere il miglior linguaggio con cui scrivere un sistema di trading automatico è necessario definire i requisiti. Il sistema sta per essere puramente esecuzione basato Sarà il sistema richiede un modulo di costruzione di gestione del rischio o portafoglio il sistema richiederà un backtester ad alte prestazioni per la maggior parte delle strategie del sistema di scambio può essere partizionato in due categorie: la ricerca e la generazione del segnale. La ricerca si occupa di valutazione di un rendimento della strategia sui dati storici. Il processo di valutazione di una strategia di trading sui dati di mercato prima è conosciuta come backtesting. La dimensione dei dati e la complessità algoritmica avranno un grande impatto sulla intensità computazionale del backtester. velocità della CPU e la concorrenza sono spesso i fattori limitanti di ottimizzare la velocità di esecuzione della ricerca. La generazione di segnali si occupa di generare una serie di segnali di trading da un algoritmo e l'invio di tali ordini al mercato, di solito tramite una società di intermediazione. Per certe strategie è richiesto un elevato livello di prestazioni. questioni IO come la larghezza di banda e la latenza sono spesso il fattore limitante per ottimizzare i sistemi di esecuzione. Così la scelta delle lingue per ogni componente del vostro intero sistema può essere molto diversa. Tipo, frequenza e volume della strategia Il tipo di strategia algoritmica impiegato avrà un impatto significativo sulla progettazione del sistema. Sarà necessario prendere in considerazione i mercati oggetto di scambio, la connettività a fornitori di dati esterni, la frequenza ed il volume della strategia, il trade-off tra la facilità di sviluppo e di ottimizzazione delle prestazioni, così come qualsiasi hardware personalizzato, compreso il co-locati personalizzato server, GPU o FPGA che potrebbero essere necessari. Le scelte tecnologiche per un a bassa frequenza US strategia di azioni saranno molto diverse da quelle di una strategia di trading arbitraggio statistico ad alta frequenza sul mercato dei futures. Prima della scelta della lingua molti fornitori di dati devono essere valutati che riguardano una strategia a portata di mano. Sarà necessario prendere in considerazione la connettività al venditore, la struttura di qualsiasi API, tempestività dei dati, requisiti di archiviazione e la resilienza di fronte ad un venditore di andare offline. E 'anche saggio di possedere un rapido accesso a più fornitori Vari strumenti tutti hanno le proprie peculiarità di storage, i cui esempi sono molteplici simboli ticker per le azioni e le date di scadenza dei futures (per non parlare di tutti i dati specifici OTC). Questo deve essere presi in considerazione per la progettazione della piattaforma. Frequenza di strategia è probabile che sia uno dei principali motori di come verrà definita la tecnologia stack. Le strategie che impiegano i dati più frequentemente di quanto minuziosamente o in secondo luogo barre richiedono una notevole considerazione per quanto riguarda le prestazioni. Una strategia superiore in secondo bar (cioè spuntare dati) porta ad un design prestazioni guidato come l'esigenza primaria. Per le strategie ad alta frequenza dovrà essere conservato e valutati una notevole quantità di dati di mercato. Software come HDF5 o KDB sono comunemente usati per questi ruoli. Per elaborare gli ampi volumi di dati necessari per applicazioni HFT, un sistema backtester ed esecuzione ampiamente ottimizzato deve essere utilizzato. CC (possibilmente con qualche assembler) è probabile che il più forte candidato lingua. strategie ultra-alta frequenza sarà quasi certamente richiedono hardware personalizzato come FPGA, lo scambio di co-locazione e messa a punto un'interfaccia kernalnetwork. Sistemi di sistemi di ricerca di ricerca di solito comporta una miscela di sviluppo interattivo e script automatizzati. Il primo avviene spesso all'interno di un IDE come Visual Studio, Matlab o R Studio. Quest'ultimo coinvolge ampi calcoli numerici più numerosi parametri e punti di dati. Questo porta ad una scelta della lingua fornire un ambiente semplice da codice di prova, ma fornisce anche prestazioni sufficienti per valutare strategie oltre dimensioni multiple parametri. IDE tipiche in questo spazio includono Microsoft Visual CC, che contiene le utility vasta debug, funzionalità di completamento del codice (tramite Intellisense) e panoramiche semplici dell'intero stack di progetto (tramite l'ORM banca dati, LINQ) MatLab. che è progettato per un'ampia algebra lineare numerica e le operazioni Vectorised, ma in un interattivo R Studio console modo. che avvolge la console linguaggio statistico R in una vera e propria IDE Eclipse IDE per Linux Java e C e IDE semi-proprietarie come Enthought Baldacchino per Python, che includono i dati librerie di analisi quali NumPy. SciPy. scikit-learn e panda in un unico ambiente interattivo (console). Per backtesting numerica, tutte le lingue sopra sono adatti, anche se non è necessario utilizzare un GUIIDE come codice verrà eseguito in background. La prima considerazione in questa fase è quella della velocità di esecuzione. Un linguaggio compilato (come C) è spesso utile se le dimensioni dei parametri backtesting sono grandi. Ricordate che è necessario diffidare di tali sistemi, se questo è il caso interpretato linguaggi come Python spesso fanno uso di librerie ad alte prestazioni, come NumPypandas per la fase test a ritroso, al fine di mantenere un ragionevole grado di competitività con equivalenti compilati. In definitiva la lingua scelta per il backtesting sarà determinata da esigenze algoritmiche nonché la gamma di librerie disponibili nella lingua (più avanti). Tuttavia, la lingua utilizzata per gli ambienti backtester e di ricerca può essere completamente indipendenti da quelli utilizzati nei componenti di costruzione del portafoglio, gestione del rischio e di esecuzione, come si vedrà. Portafoglio e gestione dei rischi Gli elementi costruttivi del portafoglio e gestione del rischio sono spesso trascurati dai commercianti algoritmico di vendita al dettaglio. Questo è quasi sempre un errore. Questi strumenti forniscono il meccanismo con cui la conservazione del capitale. Essi non solo tentativo di alleviare il numero di scommesse rischiose, ma anche ridurre al minimo il tasso di abbandono dei mestieri stessi, riducendo i costi di transazione. versioni sofisticate di questi componenti possono avere un effetto significativo sulla qualità e consistentcy della redditività. E 'semplice per creare una scuderia di strategie come il meccanismo di costruzione del portafoglio e risk manager può essere facilmente modificato per gestire più sistemi. Così essi dovrebbero essere considerati componenti essenziali fin dall'inizio della progettazione di un sistema di trading algoritmico. Il lavoro del sistema di costruzione del portafoglio è quello di prendere una serie di mestieri desiderati e produrre la serie di mestieri attuali che riducono al minimo il tasso di abbandono, mantenere l'esposizione a vari fattori (quali settori, classi di attivi, la volatilità, ecc) e ottimizzare l'allocazione del capitale alle varie strategie in un portafoglio. La costruzione del portafoglio spesso riduce ad un problema di algebra lineare (ad esempio una fattorizzazione matrice) e quindi le prestazioni dipende fortemente l'efficacia dell'applicazione algebra lineare numerica disponibili. librerie comuni includono uBLAS. LAPACK e NAG per C. MatLab possiede anche operazioni di matrice ampiamente ottimizzati. Python utilizza NumPySciPy per tali calcoli. Un portafoglio di frequente riequilibrato richiederà una libreria di matrice compilato (e ben ottimizzato) per effettuare questo passaggio fuori, in modo da non collo di bottiglia del sistema commerciale. La gestione del rischio è un altro elemento molto importante di un sistema di trading algoritmico. Il rischio può venire in molte forme: aumento della volatilità (anche se questo può essere visto come auspicabile per determinate strategie), aumento della correlazione tra le classi di attività, di default controparte, interruzioni del server, eventi cigno nero e bug rilevati nel codice di negoziazione, solo per citarne pochi. componenti di gestione del rischio cercare di anticipare gli effetti di un eccesso di volatilità e correlazione tra le classi di attività e la loro successiva effetto (s) sul capitale di trading. Spesso questo riduce ad una serie di calcoli statistici come test di stress Monte Carlo. Questo è molto simile alle esigenze di calcolo di un motore derivati ​​pricing e come tale sarà CPU-bound. Queste simulazioni sono altamente parallelizzabili (vedi sotto) e, in una certa misura, è possibile lanciare hardware al problema. Execution Systems Il lavoro del sistema di esecuzione è di ricevere segnali di trading filtrati dai componenti di costruzione del portafoglio e gestione del rischio e inviarli a una società di intermediazione o altri mezzi di accesso al mercato. Per la maggior parte delle strategie di trading algoritmico di vendita al dettaglio si tratta di una connessione API o FIX per una società di intermediazione, come Interactive Brokers. Le considerazioni principali momento di decidere su una lingua comprendono la qualità delle API, disponibilità lingua-wrapper per una API, frequenza di esecuzione e lo slittamento previsto. La qualità delle API si riferisce a come ben documentato che è, che tipo di prestazioni che fornisce, se è necessario un software standalone per accedere o se un gateway può essere stabilita in modo senza testa (cioè senza GUI). Nel caso di Interactive Brokers, lo strumento Trader stazioni di lavoro deve essere in esecuzione in un ambiente GUI per accedere loro API. Una volta ho dovuto installare una versione desktop di Ubuntu su un server cloud di Amazon per accedere Interactive Brokers da remoto, semplicemente per questo motivo la maggior parte delle API fornirà una interfaccia C Andor Java. E 'di solito fino alla comunità di sviluppare involucri specifiche della lingua per C, Python, R, Excel e MATLAB. Si noti che con tutti i plugin aggiuntivo utilizzato (soprattutto involucri API) vi è spazio per gli insetti a insinuarsi nel sistema. Verificare sempre i plugin di questo tipo e garantire sono attivamente mantenuti. Un indicatore utile è quello di vedere come molti nuovi aggiornamenti di una base di codice sono stati fatti negli ultimi mesi. frequenza di esecuzione è della massima importanza per l'algoritmo di esecuzione. Si noti che centinaia di ordini possono essere inviati ogni minuto e come tali prestazioni sono critiche. Lo slittamento sarà sostenuta attraverso un sistema di esecuzione male in sofferenza e questo avrà un impatto drammatico sulla redditività. linguaggi staticamente tipizzati (vedi sotto), come CJava sono normalmente poco idonei per l'esecuzione, ma c'è un trade-off in tempi di sviluppo, collaudo e facilità di manutenzione. linguaggi dinamicamente tipizzati, come Python e Perl sono ora generalmente abbastanza veloce. Assicurarsi sempre i componenti sono progettati in maniera modulare (vedi sotto) in modo che possano essere archiviati come le scaglie di sistema. Pianificazione e sviluppo architettonico Processo I componenti di un sistema di scambio, le sue esigenze di frequenza e il volume sono state discusse in precedenza, ma le infrastrutture del sistema è ancora da coprire. Coloro che agisce come un commerciante al dettaglio o di lavoro in un piccolo fondo sarà probabilmente indossare molti cappelli. Sarà necessario copra i parametri del modello alpha, gestione e di esecuzione, e anche la realizzazione finale del sistema. Prima di approfondire linguaggi specifici sarà discussa la progettazione di un'architettura ottimale del sistema. Separazione degli interessi Una delle decisioni più importanti che devono essere fatte in via preliminare è come separare le preoccupazioni di un sistema commerciale. Nello sviluppo di software, questo significa essenzialmente come rompere i diversi aspetti del sistema commerciale in componenti modulari separati. Esponendo interfacce a ciascuno dei componenti è facile scambiare parti del sistema per altre versioni che aiuti prestazioni, affidabilità o di manutenzione, senza modificare alcun codice dipendenza esterna. Questa è la pratica ottimale per tali sistemi. Per le strategie a frequenze più basse si consiglia tali pratiche. Per ultra high frequency trading libro delle regole potrebbe avere per essere ignorati a scapito di tweaking del sistema di prestazioni ancora più elevate. Un sistema accoppiato più stretto può essere desiderabile. Creazione di una mappa componente di un sistema di trading algoritmico vale la pena di un articolo in sé. Tuttavia, un approccio ottimale è quello di assicurarsi che non vi sono componenti separati per gli ingressi dati di mercato storici e in tempo reale, archiviazione dati, l'accesso ai dati API, backtester, parametri di strategia, di costruzione del portafoglio, gestione del rischio e sistemi di esecuzione automatica. Per esempio, se l'archivio dati utilizzati attualmente poco efficiente, anche a livelli significativi di ottimizzazione, può essere sostituita da altre riscritture minime all'ingestione di dati o di accesso ai dati API. Per quanto riguarda il come backtester e componenti successivi sono interessati, non vi è alcuna differenza. Un altro vantaggio di componenti separati è che consente una varietà di linguaggi di programmazione da utilizzare nel sistema complessivo. Non c'è bisogno di essere limitata ad una sola lingua se il metodo di comunicazione dei componenti è indipendente dalla lingua. Questo sarà il caso se comunicano via TCPIP, ZeroMQ o qualche altro protocollo indipendente dalla lingua. Come esempio concreto, si consideri il caso di un sistema di backtesting stato scritto in C per macinare il numero delle prestazioni, mentre i sistemi di portafoglio gestore ed esecuzione sono scritti in Python usando SciPy e IBPy. Considerazioni sulle prestazioni Le prestazioni sono un fattore importante per la maggior parte delle strategie di trading. Per le strategie di frequenza più alta è il fattore più importante. Prestazioni copre una vasta gamma di questioni, come la velocità di esecuzione algoritmica, la latenza di rete, la larghezza di banda, dati IO, concurrencyparallelism e il ridimensionamento. Ognuna di queste aree sono singolarmente coperti da grandi libri di testo, quindi questo articolo sarà solo graffiare la superficie di ogni argomento. Architettura e scelta della lingua saranno ora discusse in termini di effetti sulle prestazioni. La saggezza prevalente come dichiarato da Donald Knuth. uno dei padri della Computer Science, è che l'ottimizzazione prematura è la radice di tutti i mali. Questo è quasi sempre il caso - ad eccezione di quando la costruzione di un algoritmo di negoziazione ad alta frequenza Per coloro che sono interessati a strategie di frequenza più bassa, un approccio comune è quello di costruire un sistema in modo più semplice possibile e ottimizzare solo come colli di bottiglia cominciano ad apparire. Strumenti da profilatura vengono utilizzati per determinare dove sorgono i colli di bottiglia. I profili possono essere fatte per tutti i fattori sopra elencati, sia in ambiente MS Windows o Linux. Ci sono molti strumenti del sistema operativo e delle lingue disponibili a farlo, così come applicazioni di terze parti. scelta della lingua sarà ora discusso nel contesto della performance. C, Java, Python, R e MATLAB tutti contengono le librerie ad alte prestazioni (sia come parte del loro tenore o esternamente) per la struttura dati di base e il lavoro algoritmico. navi C con la Standard Template Library, mentre Python contiene NumPySciPy. operazioni matematiche comuni si trovano in queste librerie ed è raramente utile per scrivere una nuova implementazione. L'unica eccezione è se è necessario architettura hardware altamente personalizzati e un algoritmo sta facendo ampio uso di estensioni proprietarie (come cache personalizzati). Tuttavia, spesso reinvenzione del tempo rifiuti ruota che potrebbe essere speso meglio sviluppare e ottimizzare le altre parti dell'infrastruttura di trading. Il tempo di sviluppo è estremamente preziosa specialmente nel contesto di sviluppatori suola. La latenza è spesso un problema del sistema di esecuzione, come gli strumenti di ricerca di solito sono situati sulla stessa macchina. Per i primi, la latenza può verificarsi in più punti lungo il percorso di esecuzione. I database devono essere consultati (latenza disknetwork), segnali devono essere generati (syste di funzionamento, la latenza messaggistica kernal), segnali di commercio inviati (latenza NIC) e ordini processati (sistemi di scambio di latenza interna). Per le operazioni di frequenze superiori è necessario diventare intimamente familiare con ottimizzazione kernal nonché ottimizzazione della trasmissione della rete. Questa è una zona profonda ed è significativamente oltre la portata di questo articolo, ma se un algoritmo UHFT si desidera quindi essere consapevoli della profondità di conoscenza richiesto Caching è molto utile nel toolkit di uno sviluppatore di trading quantitativo. Cache si riferisce al concetto di memorizzare dati accede di frequente in modo che permette l'accesso a prestazioni superiori, a scapito del potenziale staleness dei dati. Un caso d'uso comune si verifica nello sviluppo web quando prende i dati da un database relazionale disco-backed e la messa in memoria. Eventuali successive richieste per i dati non devono colpire il database e quindi guadagni di prestazioni può essere significativo. Per le situazioni di negoziazione di cache può essere estremamente vantaggioso. Per esempio, lo stato corrente di un portafoglio strategia può essere memorizzato in una cache finché non viene riequilibrato, tale che la lista non ha bisogno di essere rigenerato ad ogni ciclo dell'algoritmo negoziazione. Tale rigenerazione è probabile che sia un elevato CPU o il funzionamento IO disco. Tuttavia, la cache non è senza i suoi problemi. Rigenerazione dei dati della cache tutti in una volta, a causa della natura volatilie di memoria cache, può mettere domanda significativa sulle infrastrutture. Un altro problema è il cane-accumulando. in cui più generazioni di una nuova copia cache vengono effettuate sotto carico particolarmente elevato, il che porta a cascata fallimento. Allocazione dinamica della memoria è un'operazione costosa in esecuzione software. Quindi è imperativo per elevate prestazioni applicazioni di trading per essere ben consapevoli di come la memoria viene allocata e deallocato durante il flusso del programma. standard linguistici più recenti come Java, C e Python svolgono tutti garbage collection automatica. che si riferisce alla deallocazione di memoria allocata dinamicamente quando gli oggetti escono di portata. la raccolta dei rifiuti è estremamente utile durante lo sviluppo in quanto riduce gli errori e gli aiuti di leggibilità. Tuttavia, è spesso sub-ottimale per certe strategie di negoziazione ad alta frequenza. Personalizzato garbage collection è spesso desiderato per questi casi. In Java, per esempio, sintonizzando garbage collector e la configurazione mucchio, è possibile avere alte prestazioni per strategie HFT. C doesnt fornire un garbage collector nativo e quindi è necessario gestire tutte allocationdeallocation memoria come parte di un'implementazione oggetti. Mentre potenzialmente soggetto ad errori (che potrebbe condurre alla puntatori penzoloni) è estremamente utile per avere un controllo granulare di come gli oggetti appaiono sul mucchio per alcune applicazioni. Quando si sceglie una lingua fare in modo di studiare come funziona il garbage collector e se può essere modificato per ottimizzare per un particolare caso d'uso. Molte operazioni nei sistemi di trading algoritmico sono suscettibili di parallelizzazione. Questo si riferisce al concetto di effettuare più operazioni programmatiche allo stesso tempo, i. e in parallelo. I cosiddetti algoritmi paralleli embarassingly includono passaggi che possono essere calcolate in modo completamente indipendente di altri passi. Alcune operazioni statistiche, come ad esempio simulazioni Monte Carlo, sono un buon esempio di algoritmi paralleli embarassingly come ogni estrazione casuale e successiva operazione di percorso può essere calcolato senza la conoscenza di altri percorsi. Altri algoritmi sono solo parzialmente parallelizzabili. fluidodinamiche simulazioni sono un esempio, in cui il dominio di calcolo può essere suddiviso, ma alla fine questi domini devono comunicare tra loro e quindi le operazioni sono parzialmente sequenziale. algoritmi parallelizzabili sono soggette a Amdahls legge. che fornisce un limite superiore teorico per l'aumento delle prestazioni di un algoritmo parallelised quando soggetto a N processi separati (ad esempio su un nucleo CPU o filo). Parallelisation has become increasingly important as a means of optimisation since processor clock-speeds have stagnated, as newer processors contain many cores with which to perform parallel calculations. The rise of consumer graphics hardware (predominently for video games) has lead to the development of Graphical Processing Units (GPUs), which contain hundreds of cores for highly concurrent operations. Such GPUs are now very affordable. High-level frameworks, such as Nvidias CUDA have lead to widespread adoption in academia and finance. Such GPU hardware is generally only suitable for the research aspect of quantitative finance, whereas other more specialised hardware (including Field-Programmable Gate Arrays - FPGAs) are used for (U)HFT. Nowadays, most modern langauges support a degree of concurrencymultithreading. Thus it is straightforward to optimise a backtester, since all calculations are generally independent of the others. Scaling in software engineering and operations refers to the ability of the system to handle consistently increasing loads in the form of greater requests, higher processor usage and more memory allocation. In algorithmic trading a strategy is able to scale if it can accept larger quantities of capital and still produce consistent returns. The trading technology stack scales if it can endure larger trade volumes and increased latency, without bottlenecking . While systems must be designed to scale, it is often hard to predict beforehand where a bottleneck will occur. Rigourous logging, testing, profiling and monitoring will aid greatly in allowing a system to scale. Languages themselves are often described as unscalable. This is usually the result of misinformation, rather than hard fact. It is the total technology stack that should be ascertained for scalability, not the language. Clearly certain languages have greater performance than others in particular use cases, but one language is never better than another in every sense. One means of managing scale is to separate concerns, as stated above. In order to further introduce the ability to handle spikes in the system (i. e. sudden volatility which triggers a raft of trades), it is useful to create a message queuing architecture. This simply means placing a message queue system between components so that orders are stacked up if a certain component is unable to process many requests. Rather than requests being lost they are simply kept in a stack until the message is handled. This is particularly useful for sending trades to an execution engine. If the engine is suffering under heavy latency then it will back up trades. A queue between the trade signal generator and the execution API will alleviate this issue at the expense of potential trade slippage. A well-respected open source message queue broker is RabbitMQ . Hardware and Operating Systems The hardware running your strategy can have a significant impact on the profitability of your algorithm. This is not an issue restricted to high frequency traders either. A poor choice in hardware and operating system can lead to a machine crash or reboot at the most inopportune moment. Thus it is necessary to consider where your application will reside. The choice is generally between a personal desktop machine, a remote server, a cloud provider or an exchange co-located server. Desktop machines are simple to install and administer, especially with newer user friendly operating systems such as Windows 78, Mac OSX and Ubuntu. Desktop systems do possess some significant drawbacks, however. The foremost is that the versions of operating systems designed for desktop machines are likely to require rebootspatching (and often at the worst of times). They also use up more computational resources by the virtue of requiring a graphical user interface (GUI). Utilising hardware in a home (or local office) environment can lead to internet connectivity and power uptime problems. The main benefit of a desktop system is that significant computational horsepower can be purchased for the fraction of the cost of a remote dedicated server (or cloud based system) of comparable speed. A dedicated server or cloud-based machine, while often more expensive than a desktop option, allows for more significant redundancy infrastructure, such as automated data backups, the ability to more straightforwardly ensure uptime and remote monitoring. They are harder to administer since they require the ability to use remote login capabilities of the operating system. In Windows this is generally via the GUI Remote Desktop Protocol (RDP). In Unix-based systems the command-line Secure SHell (SSH) is used. Unix-based server infrastructure is almost always command-line based which immediately renders GUI-based programming tools (such as MatLab or Excel) to be unusable. A co-located server, as the phrase is used in the capital markets, is simply a dedicated server that resides within an exchange in order to reduce latency of the trading algorithm. This is absolutely necessary for certain high frequency trading strategies, which rely on low latency in order to generate alpha. The final aspect to hardware choice and the choice of programming language is platform-independence. Is there a need for the code to run across multiple different operating systems Is the code designed to be run on a particular type of processor architecture, such as the Intel x86x64 or will it be possible to execute on RISC processors such as those manufactured by ARM These issues will be highly dependent upon the frequency and type of strategy being implemented. Resilience and Testing One of the best ways to lose a lot of money on algorithmic trading is to create a system with no resiliency . This refers to the durability of the sytem when subject to rare events, such as brokerage bankruptcies, sudden excess volatility, region-wide downtime for a cloud server provider or the accidental deletion of an entire trading database. Years of profits can be eliminated within seconds with a poorly-designed architecture. It is absolutely essential to consider issues such as debuggng, testing, logging, backups, high-availability and monitoring as core components of your system. It is likely that in any reasonably complicated custom quantitative trading application at least 50 of development time will be spent on debugging, testing and maintenance. Nearly all programming languages either ship with an associated debugger or possess well-respected third-party alternatives. In essence, a debugger allows execution of a program with insertion of arbitrary break points in the code path, which temporarily halt execution in order to investigate the state of the system. The main benefit of debugging is that it is possible to investigate the behaviour of code prior to a known crash point . Debugging is an essential component in the toolbox for analysing programming errors. However, they are more widely used in compiled languages such as C or Java, as interpreted languages such as Python are often easier to debug due to fewer LOC and less verbose statements. Despite this tendency Python does ship with the pdb. which is a sophisticated debugging tool. The Microsoft Visual C IDE possesses extensive GUI debugging utilities, while for the command line Linux C programmer, the gdb debugger exists. Testing in software development refers to the process of applying known parameters and results to specific functions, methods and objects within a codebase, in order to simulate behaviour and evaluate multiple code-paths, helping to ensure that a system behaves as it should. A more recent paradigm is known as Test Driven Development (TDD), where test code is developed against a specified interface with no implementation. Prior to the completion of the actual codebase all tests will fail. As code is written to fill in the blanks, the tests will eventually all pass, at which point development should cease. TDD requires extensive upfront specification design as well as a healthy degree of discipline in order to carry out successfully. In C, Boost provides a unit testing framework. In Java, the JUnit library exists to fulfill the same purpose. Python also has the unittest module as part of the standard library. Many other languages possess unit testing frameworks and often there are multiple options. In a production environment, sophisticated logging is absolutely essential. Logging refers to the process of outputting messages, with various degrees of severity, regarding execution behaviour of a system to a flat file or database. Logs are a first line of attack when hunting for unexpected program runtime behaviour. Unfortunately the shortcomings of a logging system tend only to be discovered after the fact As with backups discussed below, a logging system should be given due consideration BEFORE a system is designed. Both Microsoft Windows and Linux come with extensive system logging capability and programming languages tend to ship with standard logging libraries that cover most use cases. It is often wise to centralise logging information in order to analyse it at a later date, since it can often lead to ideas about improving performance or error reduction, which will almost certainly have a positive impact on your trading returns. While logging of a system will provide information about what has transpired in the past, monitoring of an application will provide insight into what is happening right now . All aspects of the system should be considered for monitoring. System level metrics such as disk usage, available memory, network bandwidth and CPU usage provide basic load information. Trading metrics such as abnormal pricesvolume, sudden rapid drawdowns and account exposure for different sectorsmarkets should also be continuously monitored. Further, a threshold system should be instigated that provides notification when certain metrics are breached, elevating the notification method (email, SMS, automated phone call) depending upon the severity of the metric. System monitoring is often the domain of the system administrator or operations manager. However, as a sole trading developer, these metrics must be established as part of the larger design. Many solutions for monitoring exist: proprietary, hosted and open source, which allow extensive customisation of metrics for a particular use case. Backups and high availability should be prime concerns of a trading system. Consider the following two questions: 1) If an entire production database of market data and trading history was deleted (without backups) how would the research and execution algorithm be affected 2) If the trading system suffers an outage for an extended period (with open positions) how would account equity and ongoing profitability be affected The answers to both of these questions are often sobering It is imperative to put in place a system for backing up data and also for testing the restoration of such data. Many individuals do not test a restore strategy. If recovery from a crash has not been tested in a safe environment, what guarantees exist that restoration will be available at the worst possible moment Similarly, high availability needs to be baked in from the start. Redundant infrastructure (even at additional expense) must always be considered, as the cost of downtime is likely to far outweigh the ongoing maintenance cost of such systems. I wont delve too deeply into this topic as it is a large area, but make sure it is one of the first considerations given to your trading system. Choosing a Language Considerable detail has now been provided on the various factors that arise when developing a custom high-performance algorithmic trading system. The next stage is to discuss how programming languages are generally categorised. Type Systems When choosing a language for a trading stack it is necessary to consider the type system . The languages which are of interest for algorithmic trading are either statically - or dynamically-typed . A statically-typed language performs checks of the types (e. g. integers, floats, custom classes etc) during the compilation process. Such languages include C and Java. A dynamically-typed language performs the majority of its type-checking at runtime. Such languages include Python, Perl and JavaScript. For a highly numerical system such as an algorithmic trading engine, type-checking at compile time can be extremely beneficial, as it can eliminate many bugs that would otherwise lead to numerical errors. However, type-checking doesnt catch everything, and this is where exception handling comes in due to the necessity of having to handle unexpected operations. Dynamic languages (i. e. those that are dynamically-typed) can often lead to run-time errors that would otherwise be caught with a compilation-time type-check. For this reason, the concept of TDD (see above) and unit testing arose which, when carried out correctly, often provides more safety than compile-time checking alone. Another benefit of statically-typed languages is that the compiler is able to make many optimisations that are otherwise unavailable to the dynamically - typed language, simply because the type (and thus memory requirements) are known at compile-time. In fact, part of the inefficiency of many dynamically-typed languages stems from the fact that certain objects must be type-inspected at run-time and this carries a performance hit. Libraries for dynamic languages, such as NumPySciPy alleviate this issue due to enforcing a type within arrays. Open Source or Proprietary One of the biggest choices available to an algorithmic trading developer is whether to use proprietary (commercial) or open source technologies. There are advantages and disadvantages to both approaches. It is necessary to consider how well a language is supported, the activity of the community surrounding a language, ease of installation and maintenance, quality of the documentation and any licensingmaintenance costs. The Microsoft stack (including Visual C, Visual C) and MathWorks MatLab are two of the larger proprietary choices for developing custom algorithmic trading software. Both tools have had significant battle testing in the financial space, with the former making up the predominant software stack for investment banking trading infrastructure and the latter being heavily used for quantitative trading research within investment funds. Microsoft and MathWorks both provide extensive high quality documentation for their products. Further, the communities surrounding each tool are very large with active web forums for both. The software allows cohesive integration with multiple languages such as C, C and VB, as well as easy linkage to other Microsoft products such as the SQL Server database via LINQ. MatLab also has many pluginslibraries (some free, some commercial) for nearly any quantitative research domain. There are also drawbacks. With either piece of software the costs are not insignificant for a lone trader (although Microsoft does provide entry-level version of Visual Studio for free). Microsoft tools play well with each other, but integrate less well with external code. Visual Studio must also be executed on Microsoft Windows, which is arguably far less performant than an equivalent Linux server which is optimally tuned. MatLab also lacks a few key plugins such as a good wrapper around the Interactive Brokers API, one of the few brokers amenable to high-performance algorithmic trading. The main issue with proprietary products is the lack of availability of the source code. This means that if ultra performance is truly required, both of these tools will be far less attractive. Open source tools have been industry grade for sometime. Much of the alternative asset space makes extensive use of open-source Linux, MySQLPostgreSQL, Python, R, C and Java in high-performance production roles. However, they are far from restricted to this domain. Python and R, in particular, contain a wealth of extensive numerical libraries for performing nearly any type of data analysis imaginable, often at execution speeds comparable to compiled languages, with certain caveats. The main benefit of using interpreted languages is the speed of development time. Python and R require far fewer lines of code (LOC) to achieve similar functionality, principally due to the extensive libraries. Further, they often allow interactive console based development, rapidly reducing the iterative development process. Given that time as a developer is extremely valuable, and execution speed often less so (unless in the HFT space), it is worth giving extensive consideration to an open source technology stack. Python and R possess significant development communities and are extremely well supported, due to their popularity. Documentation is excellent and bugs (at least for core libraries) remain scarce. Open source tools often suffer from a lack of a dedicated commercial support contract and run optimally on systems with less-forgiving user interfaces. A typical Linux server (such as Ubuntu) will often be fully command-line oriented. In addition, Python and R can be slow for certain execution tasks. There are mechanisms for integrating with C in order to improve execution speeds, but it requires some experience in multi-language programming. While proprietary software is not immune from dependencyversioning issues it is far less common to have to deal with incorrect library versions in such environments. Open source operating systems such as Linux can be trickier to administer. I will venture my personal opinion here and state that I build all of my trading tools with open source technologies. In particular I use: Ubuntu, MySQL, Python, C and R. The maturity, community size, ability to dig deep if problems occur and lower total cost ownership (TCO) far outweigh the simplicity of proprietary GUIs and easier installations. Having said that, Microsoft Visual Studio (especially for C) is a fantastic Integrated Development Environment (IDE) which I would also highly recommend. Batteries Included The header of this section refers to the out of the box capabilities of the language - what libraries does it contain and how good are they This is where mature languages have an advantage over newer variants. C, Java and Python all now possess extensive libraries for network programming, HTTP, operating system interaction, GUIs, regular expressions (regex), iteration and basic algorithms. C is famed for its Standard Template Library (STL) which contains a wealth of high performance data structures and algorithms for free. Python is known for being able to communicate with nearly any other type of systemprotocol (especially the web), mostly through its own standard library. R has a wealth of statistical and econometric tools built in, while MatLab is extremely optimised for any numerical linear algebra code (which can be found in portfolio optimisation and derivatives pricing, for instance). Outside of the standard libraries, C makes use of the Boost library, which fills in the missing parts of the standard library. In fact, many parts of Boost made it into the TR1 standard and subsequently are available in the C11 spec, including native support for lambda expressions and concurrency. Python has the high performance NumPySciPyPandas data analysis library combination, which has gained widespread acceptance for algorithmic trading research. Further, high-performance plugins exist for access to the main relational databases, such as MySQL (MySQLC), JDBC (JavaMatLab), MySQLdb (MySQLPython) and psychopg2 (PostgreSQLPython). Python can even communicate with R via the RPy plugin An often overlooked aspect of a trading system while in the initial research and design stage is the connectivity to a broker API. Most APIs natively support C and Java, but some also support C and Python, either directly or with community-provided wrapper code to the C APIs. In particular, Interactive Brokers can be connected to via the IBPy plugin. If high-performance is required, brokerages will support the FIX protocol . Conclusion As is now evident, the choice of programming language(s) for an algorithmic trading system is not straightforward and requires deep thought. The main considerations are performance, ease of development, resiliency and testing, separation of concerns, familiarity, maintenance, source code availability, licensing costs and maturity of libraries. The benefit of a separated architecture is that it allows languages to be plugged in for different aspects of a trading stack, as and when requirements change. A trading system is an evolving tool and it is likely that any language choices will evolve along with it. Appena iniziato con Trading Quantitative

No comments:

Post a Comment