図面 (/)

技術 操作された転写活性化因子様エフェクター(TALE)ドメインおよびその使用

出願人 プレジデントアンドフェローズオブハーバードカレッジ
発明者 リウ,デービッド,アール.ギリンジャー,ジョン,ポールパッタナヤク,ヴィクラム
出願日 2014年8月22日 (6年3ヶ月経過) 出願番号 2016-536473
公開日 2016年11月4日 (4年0ヶ月経過) 公開番号 2016-534116
状態 特許登録済
技術分野 酵素、微生物を含む測定、試験 突然変異または遺伝子工学 蛋白脂質酵素含有:その他の医薬 酵素・酵素の調製 微生物による化合物の製造 ペプチド又は蛋白質 化合物または医薬の治療活性
主要キーワード 部位長 選択感度 補償モデル モジュールアセンブリ グループ形式 相互依存関係 スペーサー内 半分部位
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2016年11月4日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (20)

課題・解決手段

操作された転写活性化因子エフェクター(TALE)は、研究および臨床の場面において用途を有するゲノム操作のための、汎用的ツールである。TALEの現在の1つの欠点は、オフターゲット配列に結合してトランケートするそれらの傾向であり、これがそれらの臨床応用を妨げ、高い適合度の結合を必要とする用途を実行不可能とする。本開示は、操作されたTALEドメインおよびかかる操作ドメインを含むTALE、例えば、改善された特異性を有する、TALEヌクレアーゼ(TALEN)、TALE転写活性化因子、TALE転写リプレッサー、TALEエピゲノム修飾酵素を、およびかかるTALEを生成して使用する方法を提供する。

概要

背景

発明の背景
転写活性化因子エフェクターヌクレアーゼ(TALEN)は、FokI制限エンドヌクレアーゼ切断ドメインとDNA結合転写活性化因子様エフェクター(TALE)反復アレイとの融合体である。TALENは、所望の標的DNA配列に特異的に結合して切断するように操作することができ、これはin vitroおよびin vivoでの核酸分子、遺伝子およびゲノムの操作のために有用である。操作されたTALENは、限定することなく基礎研究および治療的用途を含む多くの用途の場面において有用である。例えば操作されたTALENは、遺伝子ノックアウトまたはノックインの作製の場面において、ゲノムの操作のために使用することができ、これはそれぞれ、非相同末端結合(NHEJ)を介した、標的遺伝子のノックアウトのための標的ゲノム部位でのDNA切断の誘導によるか、または、相同性配向型修復HDR)を介した、外来DNA鋳型を使用する標的ゲノム配列置換による。TALENはしたがって、遺伝子操作された細胞組織、および生物の生成に有用である。

TALENは、天然および合成の配列を含む、任意の所望の標的DNA配列を切断するように設計することができる。しかし、密接に関連するオフターゲット配列から標的配列を区別するTALENの能力は、深くは研究されていない。この能力およびこれに影響を与えるパラメータを理解することは、所望の特異性ベルを有するTALENの設計に、およびまた、切断すべきユニークな標的配列を選択するため、例えば望ましくないオフターゲット切断の可能性を最小限にするために重要である。

概要

操作された転写活性化因子様エフェクター(TALE)は、研究および臨床の場面において用途を有するゲノム操作のための、汎用的ツールである。TALEの現在の1つの欠点は、オフターゲット配列に結合してトランケートするそれらの傾向であり、これがそれらの臨床応用を妨げ、高い適合度の結合を必要とする用途を実行不可能とする。本開示は、操作されたTALEドメインおよびかかる操作ドメインを含むTALE、例えば、改善された特異性を有する、TALEヌクレアーゼ(TALEN)、TALE転写活性化因子、TALE転写リプレッサー、TALEエピゲノム修飾酵素を、およびかかるTALEを生成して使用する方法を提供する。

目的

ここで紹介する研究は、TALENのオフターゲット活性をもたらす構造パラメータの、より良い理解を提供する

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

単離された転写活性化因子エフェクター(TALEドメインであって、ここで、(i)単離されたTALEドメインが、N末端TALEドメインであり、単離されたN末端ドメインの正味電荷が、生理的pHでの標準N末端ドメイン(配列番号1)の正味電荷より少ない;または(ii)単離されたTALEドメインが、C末端TALEドメインであり、C末端ドメインの正味電荷が、生理的pHでの標準C末端ドメイン(配列番号22)の正味電荷より少ない、前記単離されたTALEドメイン。

請求項2

単離されたN末端またはC末端TALEドメインであって、ここで、(i)単離されたTALEドメインが、N末端TALEドメインであり、標的核酸分子に対するN末端ドメインの結合エネルギーが、標準N末端ドメイン(配列番号1)の結合エネルギーより少ない;または(ii)単離されたTALEドメインが、C末端TALEドメインであり、標的核酸分子に対するC末端ドメインの結合エネルギーが、標準C末端ドメイン(配列番号22)の結合エネルギーより少ない、前記単離されたN末端またはC末端TALEドメイン。

請求項3

C末端ドメインの正味電荷が、+6以下、+5以下、+4以下、+3以下、+2以下、+1以下、+0以下、−1以下、−2以下、−3以下、−4以下、または−5以下である、請求項1または2に記載の単離されたTALEドメイン。

請求項4

C末端ドメインが、標準C末端ドメイン配列の少なくとも1つのカチオン性アミノ酸残基が生理的pHで電荷を示さないかまたは負電荷を示すアミノ酸残基で置き換えられている点で標準C末端ドメイン配列と異なっているアミノ酸配列を含む、請求項1〜3のいずれか一項に記載の単離されたTALEドメイン。

請求項5

N末端ドメインが、標準N末端ドメイン配列の少なくとも1つのカチオン性アミノ酸残基が、生理的pHで電荷を示さないかまたは負電荷を示すアミノ酸残基で置き換えられている点で標準N末端ドメイン配列と異なっているアミノ酸配列を含む、請求項1または2に記載の単離されたTALEドメイン。

請求項6

単離されたTALEドメインの、少なくとも1個の、少なくとも2個の、少なくとも3個の、少なくとも4個の、少なくとも5個の、少なくとも6個の、少なくとも7個の、少なくとも8個の、少なくとも9個の、少なくとも10個の、少なくとも11個の、少なくとも12個の、少なくとも13個の、少なくとも14個の、または少なくとも15個のカチオン性アミノ酸が、生理的pHで電荷を示さないかまたは負電荷を示すアミノ酸残基で置き換えられている、請求項1〜5のいずれか一項に記載の単離されたTALEドメイン。

請求項7

少なくとも1つのカチオン性アミノ酸残基が、アルギニン(R)またはリジン(K)である、請求項4〜6のいずれか一項に記載の単離されたTALEドメイン。

請求項8

生理的pHで電荷を示さないかまたは負電荷を示すアミノ酸残基が、グルタミン(Q)またはグリシン(G)である、請求項4〜7のいずれか一項に記載の単離されたTALEドメイン。

請求項9

少なくとも1つのリジンまたはアルギニン残基が、グルタミン残基で置き換えられている、請求項4〜8のいずれか一項に記載の単離されたTALEドメイン。

請求項10

C末端ドメインが、1または2以上の次のアミノ酸置換:K777Q、K778Q、K788Q、R789Q、R792Q、R793Q、R801Qを含む、請求項1〜9のいずれか一項に記載の単離されたTALEドメイン。

請求項11

C末端ドメインが、Q3バリアント配列(K788Q、R792Q、K801Q)を含む、請求項1〜10のいずれか一項に記載の単離されたTALEドメイン。

請求項12

C末端ドメインが、Q7バリアント配列(K777Q、K778Q、K788Q、R789Q、R792Q、R793Q、R801Q)を含む、請求項1〜10のいずれか一項に記載の単離されたTALEドメイン。

請求項13

N末端ドメインが、標準N末端ドメインのトランケート型である、請求項1〜12のいずれか一項に記載の単離されたTALEドメイン。

請求項14

C末端ドメインが、標準C末端ドメインのトランケート型である、請求項1〜10または13のいずれか一項に記載の単離されたTALEドメイン。

請求項15

トランケートされたドメインが、標準ドメインの残基の90%未満、80%未満、70%未満、60%未満、50%未満、40%未満、30%未満、または25%未満を含む、請求項14に記載の単離されたTALEドメイン。

請求項16

トランケートされたC末端ドメインが、60個未満、50個未満、40個未満、30個未満、29個未満、28個未満、27個未満、26個未満、25個未満、24個未満、23個未満、22個未満、21個未満、または20個未満のアミノ酸残基を含む、請求項14に記載の単離されたTALEドメイン。

請求項17

トランケートされたC末端ドメインが、60、59、58、57、56、55、54、53、52、51、50、49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、または10個の残基を含む、請求項14に記載の単離されたTALEドメイン。

請求項18

単離されたTALEドメインが、次の構造:[N末端ドメイン]−[TALE反復アレイ]−[C末端ドメイン]−[エフェクタードメイン]または[エフェクタードメイン]−[N末端ドメイン]−[TALE反復アレイ]−[C末端ドメイン]を含むTALE分子中に含まれる、請求項1〜17のいずれか一項に記載の単離されたTALEドメイン。

請求項19

エフェクタードメインが、ヌクレアーゼドメイン、転写活性化因子もしくはリプレッサードメインリコンビナーゼドメイン、またはエピゲノム修飾酵素ドメインを含む、請求項18に記載の単離されたTALEドメイン。

請求項20

TALE分子が、疾患または障害に関連することが知られている遺伝子内標的配列に結合する、請求項18または19に記載の単離されたTALEドメイン。

請求項21

以下を含む、転写活性化因子様エフェクターヌクレアーゼ(TALEN)であって、(a)ヌクレアーゼ切断ドメイン;(b)ヌクレアーゼ切断ドメインにコンジュゲートしたC末端ドメイン;(c)C末端ドメインにコンジュゲートしたTALE反復アレイ;および(d)TALE反復アレイにコンジュゲートしたN末端ドメイン、ここで、(i)N末端ドメインの正味電荷が、生理的pHでの標準N末端ドメイン(配列番号1)の正味電荷より少ない;および/または(ii)C末端ドメインの正味電荷が、生理的pHでの標準C末端ドメイン(配列番号22)の正味電荷より少ない、前記TALEN。

請求項22

以下を含む、転写活性化因子様エフェクターヌクレアーゼ(TALEN)であって、(a)ヌクレアーゼ切断ドメイン;(b)ヌクレアーゼ切断ドメインにコンジュゲートしたC末端ドメイン;(c)C末端ドメインにコンジュゲートしたTALE反復アレイ;および(d)TALE反復アレイにコンジュゲートしたN末端ドメイン、ここで、(i)標的核酸分子に対するN末端ドメインの結合エネルギーが、標準N末端ドメイン(配列番号1)の結合エネルギーより少ない;および/または(ii)標的核酸分子に対するC末端ドメインの結合エネルギーが、標準C末端ドメイン(配列番号22)の結合エネルギーより少ない、前記TALEN。

請求項23

C末端ドメインの正味電荷が、+6以下、+5以下、+4以下、+3以下、+2以下、+1以下、+0以下、−1以下、−2以下、−3以下、−4以下、または−5以下である、請求項21または22に記載のTALEN。

請求項24

N末端ドメインが、標準N末端ドメイン配列の少なくとも1つのカチオン性アミノ酸残基が生理的pHで電荷を示さないかまたは負電荷を示すアミノ酸残基で置き換えられている点で標準N末端ドメイン配列と異なっているアミノ酸配列を含む、請求項21〜23のいずれか一項に記載のTALEN。

請求項25

C末端ドメインが、標準C末端ドメイン配列の少なくとも1つのカチオン性アミノ酸残基が生理的pHで電荷を示さないかまたは負電荷を示すアミノ酸残基で置き換えられている点で標準C末端ドメイン配列と異なっているアミノ酸配列を含む、請求項21〜24のいずれか一項に記載のTALEN。

請求項26

N末端ドメインおよび/またはC末端ドメインにおいて、少なくとも1個の、少なくとも2個の、少なくとも3個の、少なくとも4個の、少なくとも5個の、少なくとも6個の、少なくとも7個の、少なくとも8個の、少なくとも9個の、少なくとも10個の、少なくとも11個の、少なくとも12個の、少なくとも13個の、少なくとも14個の、または少なくとも15個のカチオン性アミノ酸が、生理的pHで電荷を示さないかまたは負電荷を示すアミノ酸残基で置き換えられている、請求項21〜25のいずれか一項に記載のTALEN。

請求項27

少なくとも1つのカチオン性アミノ酸残基が、アルギニン(R)またはリジン(K)である、請求項24〜26のいずれか一項に記載のTALEN。

請求項28

生理的pHで電荷を示さないかまたは負電荷を示すアミノ酸残基が、グルタミン(Q)またはグリシン(G)である、請求項24〜27のいずれか一項に記載のTALEN。

請求項29

少なくとも1つのリジンまたはアルギニン残基が、グルタミン残基で置き換えられている、請求項24〜28のいずれか一項に記載のTALEN。

請求項30

C末端ドメインが、1または2以上の次のアミノ酸置換:K777Q、K778Q、K788Q、R789Q、R792Q、R793Q、R801Qを含む、請求項21〜29のいずれか一項に記載のTALEN。

請求項31

C末端ドメインが、Q3バリアント配列(K788Q、R792Q、K801Q)を含む、請求項21〜30のいずれか一項に記載のTALEN。

請求項32

C末端ドメインが、Q7バリアント配列(K777Q、K778Q、K788Q、R789Q、R792Q、R793Q、R801Q)を含む、請求項21〜30のいずれか一項に記載のTALEN。

請求項33

N末端ドメインが、標準N末端ドメインのトランケート型である、請求項21〜32のいずれか一項に記載のTALEN。

請求項34

C末端ドメインが、標準C末端ドメインのトランケート型である、請求項21〜30または33のいずれか一項に記載のTALEN。

請求項35

トランケートされたドメインが、標準ドメインの残基の90%未満、80%未満、70%未満、60%未満、50%未満、40%未満、30%未満、または25%未満を含む、請求項34に記載のTALEN。

請求項36

トランケートされたC末端ドメインが、60個未満、50個未満、40個未満、30個未満、29個未満、28個未満、27個未満、26個未満、25個未満、24個未満、23個未満、22個未満、21個未満、または20個未満のアミノ酸残基を含む、請求項34に記載のTALEN。

請求項37

トランケートされたC末端ドメインが、60、59、58、57、56、55、54、53、52、51、50、49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、または10個の残基を含む、請求項34に記載のTALEN。

請求項38

ヌクレアーゼ切断ドメインが、FokIヌクレアーゼドメインである、請求項21〜37のいずれか一項に記載のTALEN。

請求項39

FokIヌクレアーゼドメインが、配列番号26〜30で提供される配列を含む、請求項21〜38のいずれか一項に記載のTALEN。

請求項40

TALENが単量体である、請求項21〜39のいずれか一項に記載のTALEN。

請求項41

TALEN単量体が、別のTALEN単量体と二量体化してTALEN二量体を形成することができる、請求項40に記載のTALEN。

請求項42

二量体が、ヘテロ二量体である、請求項41に記載のTALEN。

請求項43

TALENが、疾患または障害に関連することが知られている遺伝子内の標的配列に結合する、請求項21〜42のいずれか一項に記載のTALEN。

請求項44

TALENが、二量体化の際に標的配列を切断する、請求項43に記載のTALEN。

請求項45

疾患が、HIVAIDSまたは増殖性疾患である、請求項43または44に記載のTALEN。

請求項46

TALENが、CCR5標的配列に結合する、請求項31〜45のいずれか一項に記載のTALEN。

請求項47

TALENが、ATM標的配列に結合する、請求項21〜45のいずれか一項に記載のTALEN。

請求項48

TALENが、VEFA標的配列に結合する、請求項21〜45のいずれか一項に記載のTALEN。

請求項49

請求項21〜48のいずれか一項に記載のTALENと、該TALENと共にヘテロ二量体を形成することができる異なるTALENとを含む組成物であって、ここで該二量体がヌクレアーゼ活性を示す、前記組成物。

請求項50

請求項21〜48のいずれか一項に記載のTALENまたは請求項29に記載の組成物、および薬学的に許容し得る賦形剤を含む、医薬組成物

請求項51

医薬組成物が、対象への投与のために処方される、請求項50に記載の医薬組成物。

請求項52

医薬組成物が、対象の細胞内の標的配列を切断するための有効量のTALENを含む、請求項50または51に記載の医薬組成物。

請求項53

請求項50または51に記載の医薬組成物であって、ここでTALENが疾患または障害と関連することが知られている遺伝子内の標的配列に結合し、およびここで前記組成物が疾患または障害に関連する症状を軽減するための有効量のTALENを含む、前記組成物。

請求項54

核酸分子中の標的配列を切断する方法であって、標的配列を含む核酸分子を、TALENが標的配列に結合して標的配列を切断するのに好適な条件下で、標的配列に結合するTALENと接触させることを含み、ここでTALENが請求項21〜48のいずれか一項に記載のTALENであるか、またはここでTALENが請求項49に記載の組成物中もしくは請求項50〜53のいずれか一項に記載の医薬組成物中に含まれている、前記方法。

請求項55

標的配列が細胞に含まれている、請求項54に記載の方法。

請求項56

標的配列が対象に含まれている、請求項54または55に記載の方法。

請求項57

方法が、TALENを含む組成物または医薬組成物を、対象に対して、TALENが標的部位に結合して標的部位を切断するための充分な量で投与することを含む、請求項56に記載の方法。

請求項58

操作されたTALENを製造する方法であって、方法が、標準N末端TALENドメインおよび/または標準C末端TALENドメインの少なくとも1つのアミノ酸を、生理的pHで電荷を有さないかまたは負電荷を有するアミノ酸で置き換えること;および/またはN末端TALENドメインおよび/またはC末端TALENドメインをトランケートして、正に荷電した断片を除去すること;したがって、減少した正味電荷のN末端ドメインおよび/またはC末端ドメインを有する、操作されたTALENを生成すること、を含む、前記方法。

請求項59

置き換えられる少なくとも1つのアミノ酸が、カチオン性アミノ酸または生理的pHで正電荷を有するアミノ酸を含む、請求項58に記載の方法。

請求項60

少なくとも1つのアミノ酸を置き換えるアミノ酸が、カチオン性アミノ酸または中性のアミノ酸である、請求項58または59に記載の方法。

請求項61

トランケートされたN末端TALENドメインおよび/またはトランケートされたC末端TALENドメインが、それぞれの標準ドメインの残基の90%未満、80%未満、70%未満、60%未満、50%未満、40%未満、30%未満、または25%未満を含む、請求項58〜60のいずれか一項に記載の方法。

請求項62

トランケートされたC末端ドメインが、60個未満、50個未満、40個未満、30個未満、29個未満、28個未満、27個未満、26個未満、25個未満、24個未満、23個未満、22個未満、21個未満、または20個未満のアミノ酸残基を含む、請求項58〜61のいずれか一項に記載の方法。

請求項63

トランケートされたC末端ドメインが、60、59、58、57、56、55、54、53、52、51、50、49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、または10個のアミノ酸残基を含む、請求項58〜61のいずれか一項に記載の方法。

請求項64

標準N末端TALENドメインおよび/または標準C末端TALENドメインの少なくとも2個、少なくとも3個、少なくとも4個、少なくとも5個、少なくとも6個、少なくとも7個、少なくとも8個、少なくとも9個、少なくとも10個、少なくとも11個、少なくとも12個、少なくとも13個、少なくとも14個、または少なくとも15個のアミノ酸を、生理的pHで電荷を有さないかまたは負電荷を有するアミノ酸で置き換えることを含む、請求項58〜63のいずれか一項に記載の方法。

請求項65

置き換えられるアミノ酸が、アルギニン(R)またはリジン(K)である、請求項58〜64のいずれか一項に記載の方法。

請求項66

生理的pHで電荷を有さないかまたは負電荷を有するアミノ酸が、グルタミン(Q)またはグリシン(G)である、請求項58〜65のいずれか一項に記載の方法。

請求項67

少なくとも1つのリジンまたはアルギニン残基を、グルタミン残基で置き換えることを含む、請求項58〜66のいずれか一項に記載の方法。

請求項68

請求項21〜48のいずれか一項に記載のTALEN、請求項49に記載の組成物、または請求項50〜53のいずれか一項に記載の医薬組成物を含む、キット

請求項69

TALENを賦形剤と接触させて、核酸をTALENと接触させるのに好適な組成物を生成するための、賦形剤および指示書を含む、請求項68に記載のキット。

請求項70

賦形剤が、薬学的に許容し得る賦形剤である、請求項69に記載のキット。

技術分野

0001

関連出願
本出願は、35 U.S.C. § 365(c)の下で、2014年6月30日に出願されたU.S.S.N. 14/320,519の優先権を主張し、また、35 U.S.C. § 119(e)の下で、2013年8月22日に出願された米国仮特許出願U.S.S.N. 61/868,846の優先権を主張する;これらの出願の各々は、本明細書に参照により組み込まれる。

0002

政府支援
本発明は、米国政府の支援を受け、Defense Advanced Research Projects Agencyによって授与されたグラントHR0011-11-2-0003およびN66001-12-C-4207;National Institute of General Medical Sciencesによって授与されたグラントT32GM007753;およびNational Institutes of Healthによって授与されたグラントDP1 GM105378のもとでなされた。米国政府は本発明において一定の権利を有する。

背景技術

0003

発明の背景
転写活性化因子エフェクターヌクレアーゼ(TALEN)は、FokI制限エンドヌクレアーゼ切断ドメインとDNA結合転写活性化因子様エフェクター(TALE)反復アレイとの融合体である。TALENは、所望の標的DNA配列に特異的に結合して切断するように操作することができ、これはin vitroおよびin vivoでの核酸分子、遺伝子およびゲノムの操作のために有用である。操作されたTALENは、限定することなく基礎研究および治療的用途を含む多くの用途の場面において有用である。例えば操作されたTALENは、遺伝子ノックアウトまたはノックインの作製の場面において、ゲノムの操作のために使用することができ、これはそれぞれ、非相同末端結合(NHEJ)を介した、標的遺伝子のノックアウトのための標的ゲノム部位でのDNA切断の誘導によるか、または、相同性配向型修復HDR)を介した、外来DNA鋳型を使用する標的ゲノム配列置換による。TALENはしたがって、遺伝子操作された細胞組織、および生物の生成に有用である。

0004

TALENは、天然および合成の配列を含む、任意の所望の標的DNA配列を切断するように設計することができる。しかし、密接に関連するオフターゲット配列から標的配列を区別するTALENの能力は、深くは研究されていない。この能力およびこれに影響を与えるパラメータを理解することは、所望の特異性ベルを有するTALENの設計に、およびまた、切断すべきユニークな標的配列を選択するため、例えば望ましくないオフターゲット切断の可能性を最小限にするために重要である。

0005

TALENは、in vitroおよびin vivoでの遺伝子およびゲノムの操作のための用途の広いツールであり、その理由は、TALENが、核酸分子内の実質的に全ての標的配列に結合して切断するように設計することができるからである。例えば、TALENは、DNA切断の誘導を介した、細胞のゲノム内のDNA配列の標的化された除去のために使用することができ、該DNA切断は、次に、非相同末端結合(NHEJ)を介して、細胞のDNA修復機構により修復される。TALENはまた、ゲノム配列に挿入される配列を含む核酸の存在下で、相同性配向型修復(HDR)を介した、標的化された配列置換のためにも使用することができる。TALENは生細胞のゲノムを操作するために使用可能であるため、得られた遺伝的に修飾された細胞は、形質転換された細胞または組織培養物および生物を生成するために、使用することができる。

0006

複雑な試料の場面で、例えばゲノムの場面において、TALENがDNA配列の標的切断のために使用されるシナリオでは、TALENが特定の標的配列のみに結合して切断し、オフターゲット切断活性はないか、または最小であることが、多くの場合に望ましい(例えば、PCT出願公開WO2013/066438 A2を参照、この全内容は本明細書に参照により組み込まれる)。いくつかの態様において、理想的なTALENは、その意図する標的配列にのみ特異的に結合し、全くオフターゲット活性を有さず、したがって単一の配列の標的切断、例えば、全ゲノムの場面においては目的の遺伝子の単一のアレルのみの標的切断を、可能とする。

0007

本開示のいくつかの側面は、TALENの、オフターゲット配列を切断するという傾向およびオフターゲットTALEN活性の性質に影響するパラメータについては、あまり理解されていないとの認識に基づく。ここで紹介する研究は、TALENのオフターゲット活性をもたらす構造パラメータの、より良い理解を提供する。オフターゲット活性を有さないか、最小限にしか有さない、操作されたTALENを生成するための方法およびシステムが、本明細書に提供され、また、増加したオンターゲット切断効率および最小限のオフターゲット活性を有する、操作されたTALENも提供される。TALENによる、非特異的またはオフターゲットDNA結合を低減するための、本明細書に提供される戦略、方法、および試薬は、他のDNA結合タンパク質にも適用可能であることが、当業者によって理解されるであろう。特に、DNAへの非特異的結合を低減するために、DNA結合タンパク質のアミノ酸配列を修飾するための戦略であって、カチオン性アミノ酸残基を、カチオン性ではないか、非荷電であるか、または生理的pHでアニオン性ではないアミノ酸残基で置換することによる、前記戦略を使用して、例えば、他のTALEエフェクタータンパク質、操作されたジンクフィンガータンパク質ジンクフィンガーヌクレアーゼを含む)、およびCas9タンパク質などの特異性を減少させることができる。

0008

本開示のいくつかの側面は、操作され、単離された転写活性化因子様エフェクター(TALE)ドメインを提供する。いくつかの態様において、単離されたTALEドメインはN末端TALEドメインであり、単離されたN末端ドメインの正味電荷は、生理的pHでの標準N末端ドメイン(配列番号1)の正味電荷より少ない。いくつかの態様において、単離されたTALEドメインはC末端TALEドメインであり、C末端ドメインの正味電荷は、生理的pHでの標準C末端ドメイン(配列番号22)の正味電荷より少ない。いくつかの態様において、単離されたTALEドメインはN末端TALEドメインであり、標的核酸分子に対するN末端ドメインの結合エネルギーは、標準N末端ドメイン(配列番号1)の結合エネルギーより少ない。いくつかの態様において、単離されたTALEドメインはC末端TALEドメインであり、標的核酸分子に対するC末端ドメインの結合エネルギーは、標準C末端ドメイン(配列番号22)の結合エネルギーより少ない。いくつかの態様において、C末端ドメインの正味電荷は、+6以下、+5以下、+4以下、+3以下、+2以下、+1以下、+0以下、−1以下、−2以下、−3以下、−4以下、または−5以下である。いくつかの態様において、C末端ドメインはアミノ酸配列を含み、該アミノ酸配列は、標準C末端ドメイン配列とは次の点で、すなわち標準C末端ドメイン配列の少なくとも1つのカチオン性アミノ酸残基が、生理的pHで電荷を示さないかまたは負電荷を示すアミノ酸残基で置き換えられている点で異なっている。いくつかの態様において、N末端ドメインはアミノ酸配列を含み、該アミノ酸配列は、標準N末端ドメイン配列とは次の点で、すなわち標準N末端ドメイン配列の少なくとも1つのカチオン性アミノ酸残基が、生理的pHで電荷を示さないかまたは負電荷を示すアミノ酸残基で置き換えられている点で異なっている。いくつかの態様において、単離されたTALEドメインの、少なくとも1個の、少なくとも2個の、少なくとも3個の、少なくとも4個の、少なくとも5個の、少なくとも6個の、少なくとも7個の、少なくとも8個の、少なくとも9個の、少なくとも10個の、少なくとも11個の、少なくとも12個の、少なくとも13個の、少なくとも14個の、または少なくとも15個のカチオン性アミノ酸残基は、生理的pHで電荷を示さないかまたは負電荷を示すアミノ酸残基で置き換えられている。いくつかの態様において、少なくとも1つのカチオン性アミノ酸残基は、アルギニン(R)またはリジン(K)である。いくつかの態様において、生理的pHで電荷を示さないかまたは負電荷を示すアミノ酸残基は、グルタミン(Q)またはグリシン(G)である。いくつかの態様において、少なくとも1つのリジンまたはアルギニン残基は、グルタミン残基で置き換えられている。いくつかの態様において、C末端ドメインは、1または2以上の次のアミノ酸置換:K777Q、K778Q、K788Q、R789Q、R792Q、R793Q、R801Q、を含む。いくつかの態様において、C末端ドメインは、Q3バリアント配列(K788Q、R792Q、K801Q)を含む。いくつかの態様において、C末端ドメインは、Q7バリアント配列(K777Q、K778Q、K788Q、R789Q、R792Q、R793Q、R801Q)を含む。いくつかの態様において、N末端ドメインは、標準N末端ドメインのトランケート型である。いくつかの態様において、C末端ドメインは、標準C末端ドメインのトランケート型である。いくつかの態様において、トランケートされたドメインは、標準ドメインの残基の90%未満、80%未満、70%未満、60%未満、50%未満、40%未満、30%未満、または25%未満を含む。いくつかの態様において、トランケートされたC末端ドメインは、60個未満、50個未満、40個未満、30個未満、29個未満、28個未満、27個未満、26個未満、25個未満、24個未満、23個未満、22個未満、21個未満、または20個未満のアミノ酸残基を含む。いくつかの態様において、トランケートされたC末端ドメインは、60、59、58、57、56、55、54、53、52、51、50、49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、または10個の残基を含む。いくつかの態様において、単離されたTALEドメインは、次の構造:[N末端ドメイン]−[TALE反復アレイ]−[C末端ドメイン]−[エフェクタードメイン];または[エフェクタードメイン]−[N末端ドメイン]−[TALE反復アレイ]−[C末端ドメイン]、を含むTALE分子中に含まれる。いくつかの態様において、エフェクタードメインは、ヌクレアーゼドメイン、転写活性化因子もしくはリプレッサードメインリコンビナーゼドメイン、またはエピゲノム修飾酵素ドメインを含む。いくつかの態様において、TALE分子は、疾患または障害に関連することが知られている遺伝子内の標的配列に結合する。

0009

本開示のいくつかの側面は、標準TALENと比較して、修飾された正味電荷および/またはそれらの標的核酸配列に結合する修飾された結合エネルギーを有する、転写活性化因子様エフェクターヌクレアーゼ(TALEN)を提供する。典型的には、本発明のTALENは、(a)ヌクレアーゼ切断ドメイン;(b)ヌクレアーゼ切断ドメインにコンジュゲートしたC末端ドメイン;(c)C末端ドメインにコンジュゲートしたTALE反復アレイ;および(d)TALE反復アレイにコンジュゲートしたN末端ドメイン、を含む。いくつかの態様において、(i)生理的pHでのN末端ドメインの正味電荷は、生理的pHでの標準N末端ドメイン(配列番号1)の正味電荷より少なく;および/または(ii)生理的pHでのC末端ドメインの正味電荷は、生理的pHでの標準C末端ドメイン(配列番号22)の正味電荷より少ない。いくつかの態様において、(i)標的核酸分子に対するN末端ドメインの結合エネルギーは、標準N末端ドメイン(配列番号1)の結合エネルギーより少なく;および/または(ii)標的核酸分子に対するC末端ドメインの結合エネルギーは、標準C末端ドメイン(配列番号22)の結合エネルギーより少ない。いくつかの態様において、(i)標的核酸分子に対するN末端ドメインの結合エネルギーは、標準N末端ドメイン(配列番号1)の結合エネルギーより少ない;および/または(ii)標的核酸分子に対するC末端ドメインの結合エネルギーは、標準C末端ドメイン(配列番号22)の結合エネルギーより少ない。いくつかの態様において、生理的pHでのC末端ドメインの正味電荷は、+6以下、+5以下、+4以下、+3以下、+2以下、+1以下、+0以下、−1以下、−2以下、−3以下、−4以下、または−5以下である。いくつかの態様において、N末端ドメインはアミノ酸配列を含み、該アミノ酸配列は、標準N末端ドメイン配列の少なくとも1つのカチオン性アミノ酸残基が、カチオン性電荷を有さないか、電荷を全く有さないか、またはアニオン性電荷を有するアミノ酸残基で置き換えられている点で、標準N末端ドメイン配列とは異なっている。いくつかの態様において、C末端ドメインはアミノ酸配列を含み、該アミノ酸配列は、標準C末端ドメイン配列の少なくとも1つのカチオン性アミノ酸残基が、カチオン性電荷を有さないか、電荷を全く有さないか、またはアニオン性電荷を有するアミノ酸残基で置き換えられている点で、標準C末端ドメイン配列とは異なっている。いくつかの態様において、N末端ドメインおよび/またはC末端ドメインにおいて、少なくとも1個の、少なくとも2個の、少なくとも3個の、少なくとも4個の、少なくとも5個の、少なくとも6個の、少なくとも7個の、少なくとも8個の、少なくとも9個の、少なくとも10個の、少なくとも11個の、少なくとも12個の、少なくとも13個の、少なくとも14個の、または少なくとも15個のカチオン性アミノ酸は、カチオン性電荷を有さないか、電荷を全く有さないか、またはアニオン性電荷を有するアミノ酸残基で置き換えられている。いくつかの態様において、少なくとも1つのカチオン性アミノ酸残基は、アルギニン(R)またはリジン(K)である。いくつかの態様において、カチオン性アミノ酸を置き換えるアミノ酸残基は、グルタミン(Q)またはグリシン(G)である。本開示の側面に従って置換され得るC末端ドメインの正に荷電した残基としては、限定はされないが、アルギニン(R)残基およびリジン(K)残基、例えば、C末端ドメインのR747、R770、K777、K778、K788、R789、R792、R793、R797、およびR801である(例えば配列番号22を参照、番号付け完全長TALENタンパク質のそれぞれの残基の位置を示し、配列番号22に提供されるC末端ドメインの同等の位置は、R8、R30、K37、K38、K48、R49、R52、R53、R57、R61である)。本開示の側面に従って置換され得るN末端ドメインの正に荷電した残基としては、限定はされないが、アルギニン(R)残基およびリジン(K)残基、例えば、K57、K78、R84、R97、K110、K113、およびR114(例えば、配列番号1を参照)が挙げられる。いくつかの態様において、少なくとも1つのリジンまたはアルギニン残基は、グルタミン残基で置き換えられている。いくつかの態様において、C末端ドメインは、1または2以上の次のアミノ酸置換:K777Q、K778Q、K788Q、R789Q、R792Q、R793Q、R801Q、を含む。いくつかの態様において、C末端ドメインは、Q3バリアント配列(K788Q、R792Q、K801Q)を含む。いくつかの態様において、C末端ドメインは、Q7バリアント配列(K777Q、K778Q、K788Q、R789Q、R792Q、R793Q、R801Q)を含む。いくつかの態様において、N末端ドメインは、標準N末端ドメインのトランケート型である。いくつかの態様において、C末端ドメインは、標準C末端ドメインのトランケート型である。いくつかの態様において、トランケートされたドメインは、標準ドメインの残基の90%未満、80%未満、70%未満、60%未満、50%未満、40%未満、30%未満、または25%未満を含む。いくつかの態様において、トランケートされたC末端ドメインは、60個未満、50個未満、40個未満、30個未満、29個未満、28個未満、27個未満、26個未満、25個未満、24個未満、23個未満、22個未満、21個未満、または20個未満のアミノ酸残基を含む。いくつかの態様において、トランケートされたC末端ドメインは、60、59、58、57、56、55、54、53、52、51、50、49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、または10個の残基を含む。いくつかの態様において、ヌクレアーゼ切断ドメインは、FokIヌクレアーゼドメインである。いくつかの態様において、FokIヌクレアーゼドメインは、配列番号26〜30で提供される配列を含む。いくつかの態様において、TALENは単量体である。いくつかの態様において、TALEN単量体は、別のTALEN単量体と二量体化してTALEN二量体を形成する。いくつかの態様において、二量体は、ヘテロ二量体である。いくつかの態様において、TALENは、疾患または障害に関連することが知られている遺伝子内の標的配列に結合する。いくつかの態様において、TALENは、二量体化の際に標的配列を切断する。いくつかの態様において、処置または予防される疾患は、HIV感染またはAIDS、または増殖性疾患である。いくつかの態様において、TALENは、HIV感染またはAIDSの処置または予防において、CCR5(C−Cケモカイン受容体5型)標的配列に結合する。いくつかの態様において、TALENは、ATM毛細血管拡張性運動失調症変異)標的配列に結合する。いくつかの態様において、TALENは、VEFA血管内皮増殖因子A)標的配列に結合する。

0010

本開示のいくつかの側面は、本明細書に記載のTALENを、例えばTALEN単量体を含む、組成物を提供する。いくつかの態様において、組成物は、本発明のTALEN単量体および、ヘテロ二量体を形成する別のTALEN単量体を含み、ここで二量体は、ヌクレアーゼ活性を示す。いくつかの態様において、組成物は医薬組成物である。

0011

本開示のいくつかの側面は、本明細書に提供されるTALENを含む組成物を提供する。いくつかの態様において、組成物は、in vitroで細胞または組織と接触させるのに好適になるように処方される。いくつかの態様において、医薬組成物は、例えば、in vitroまたはex vivoでの細胞または組織内の標的配列を切断するための、TALENの有効量を含む。いくつかの態様において、TALENは、目的の遺伝子内の標的配列、例えば疾患または障害と関連することが知られている遺伝子内の標的配列に結合し、および組成物は、疾患または障害に関連する徴候および/または症状を軽減するための、TALENの有効量を含む。本開示のいくつかの側面は、本明細書に提供されるTALENおよび薬学的に許容し得る賦形剤を含む、医薬組成物を提供する。いくつかの態様において、医薬組成物は、対象への投与のために処方される。いくつかの態様において、医薬組成物は、対象における細胞の標的配列を切断するためのTALENの有効量を含む。いくつかの態様において、TALENは、疾患または障害と関連することが知られている遺伝子内の標的配列に結合し、組成物は、疾患または障害に関連する徴候および/または症状を緩和するための、TALENの有効量を含む。

0012

本開示のいくつかの側面は、本明細書に提供されるTALENを用いて、核酸分子内の標的配列を切断する方法を提供する。いくつかの態様において、方法は、標的配列を含む核酸分子を、標的配列に結合する本発明のTALENと、TALENが標的配列に結合して切断するのに好適な条件下で、接触させることを含む。いくつかの態様において、TALENは、単量体として提供される。いくつかの態様において、本発明のTALEN単量体は、本発明のTALEN単量体と二量体化してヌクレアーゼ活性を有するヘテロ二量体を形成することができる異なるTALEN単量体を含む、組成物中で提供される。いくつかの態様において、本発明のTALENは、医薬組成物中で提供される。いくつかの態様において、標的配列は、細胞のゲノム内にある。いくつかの態様において、標的配列は、対象の中にある。いくつかの態様において、方法は、TALENを含む例えば医薬組成物などの組成物を、対象に対して、TALENが標的部位に結合して切断するのに充分な量で、投与することを含む。

0013

本開示のいくつかの側面は、操作されたTALENを製造する方法を提供する。いくつかの態様において、方法は、標準N末端TALENドメインおよび/または標準C末端TALENドメインの少なくとも1個のアミノ酸を、置き換えられるアミノ酸と比較して生理的pHで電荷を有さないかまたは負電荷を有するアミノ酸で置き換えること;および/または、N末端TALENドメインおよび/またはC末端TALENドメインをトランケートして、正に荷電した断片を除去すること;したがって、生理的pHで減少した正味電荷のN末端ドメインおよび/またはC末端ドメインを有する、操作されたTALENを生成すること、を含む。いくつかの態様において、置換されている少なくとも1つのアミノ酸は、カチオン性アミノ酸または生理的pHで正電荷を有するアミノ酸を含む。本開示の側面に従って置換され得るC末端ドメインの正に荷電した残基としては、限定はされないが、アルギニン(R)残基およびリジン(K)残基、例えば、C末端ドメインのR747、R770、K777、K778、K788、R789、R792、R793、R797、およびR801が挙げられる。本開示の側面に従って置換され得るN末端ドメインの正に荷電した残基としては、限定はされないが、アルギニン(R)残基およびリジン(K)残基、例えば、K57、K78、R84、R97、K110、K113、およびR114が挙げられる。いくつかの態様において、少なくとも1つのアミノ酸を置き換えるアミノ酸は、カチオン性アミノ酸または中性のアミノ酸である。いくつかの態様において、トランケートされたN末端TALENドメインおよび/またはトランケートされたC末端TALENドメインは、それぞれの標準ドメインの残基の90%未満、80%未満、70%未満、60%未満、50%未満、40%未満、30%未満、または25%未満を含む。いくつかの態様において、トランケートされたC末端ドメインは、60個未満、50個未満、40個未満、30個未満、29個未満、28個未満、27個未満、26個未満、25個未満、24個未満、23個未満、22個未満、21個未満、または20個未満のアミノ酸残基を含む。いくつかの態様において、トランケートされたC末端ドメインは、60、59、58、57、56、55、54、53、52、51、50、49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、または10個のアミノ酸残基を含む。いくつかの態様において、方法は、標準N末端TALENドメインおよび/または標準C末端TALENドメインの少なくとも2個、少なくとも3個、少なくとも4個、少なくとも5個、少なくとも6個、少なくとも7個、少なくとも8個、少なくとも9個、少なくとも10個、少なくとも11個、少なくとも12個、少なくとも13個、少なくとも14個、または少なくとも15個のアミノ酸を、生理的pHで電荷を有さないかまたは負電荷を有するアミノ酸で置き換えることを含む。いくつかの態様において、置き換えられるアミノ酸は、アルギニン(R)またはリジン(K)である。いくつかの態様において、生理的pHで電荷を有さないかまたは負電荷を有するアミノ酸は、グルタミン(Q)またはグリシン(G)である。いくつかの態様において、方法は、少なくとも1つのリジンまたはアルギニン残基を、グルタミン残基で置き換えることを含む。

0014

本開示のいくつかの側面は、本明細書に提供される操作されたTALEN、またはかかるTALENを含む組成物(例えば、医薬組成物)を含む、キットを提供する。いくつかの態様において、キットは、TALENを賦形剤と接触させて、核酸をTALENと接触させるのに好適な組成物を生成するための、賦形剤および指示書を含む。いくつかの態様において、賦形剤は薬学的に許容可能な賦形剤である。

0015

上記の概要は、本明細書に開示された技術のいくつかの態様、利点、特徴、および使用について、非限定的に説明することを意図する。本明細書に開示された技術の他の態様、利点、特徴、および使用は、詳細な説明、図面、例、および特許請求の範囲から明らかであろう。

図面の簡単な説明

0016

TALEN構築物(architecture)および選択スキーム。(A)TALENの構築物。TALEN単量体は、N末端ドメインに続いてTALE反復のアレイ、C末端ドメイン、およびFokIヌクレアーゼ切断ドメインを含む。各TALE反復の12番目と13番目のアミノ酸(RVD、赤)は、特定のDNA塩基対を認識する。2つの異なるTALENは、それらに対応する半部位に結合し、FokIの二量体化およびDNA切断を可能にする。本研究で用いたC末端ドメインバリアントが示されている。(B)部分的にランダム化された左半部位(L)、スペーサー(S)、右半部位(R)および定常領域(太い黒線)を含むDNAオリゴヌクレオチド一本鎖ライブラリーを環状化し、ローリングサークル増幅によりコンカテマー化した。得られたDNAライブラリーを、目的のin vitro翻訳したTALENと共にインキュベートした。切断されたライブラリーメンバー平滑化し、アダプター#1にライゲートした。ライゲーション産物は、アダプター#1からなる1つのプライマーと、アダプター#2−定常配列からなる、定常領域にアニーリングする別のプライマーを使用して、PCRにより増幅した。長さが



の標的配列カセットアンプリコンゲル精製によって単離し、ハイスループットDNAシーケンシングおよびコンピューター分析に供した。

0017

in vitro選択の結果。選択を耐えた配列(灰色)および選択前配列(黒)の割合を、両方の半部位における変異数の関数として、CCR5A TALEN(A)およびATMTALEN(B)について示す。(C)標的半部位における全ての位置、および単一の隣接位置における、L18+R18 CCR5A TALENについての特異性スコア。色は、最大特異性スコアの1.0〜白(特異性なし、スコア0)〜最大の負のスコアの−1.0の範囲である。枠内の塩基は、意図された標的塩基を表す。(D)L18+R18 ATM TALENについて、(C)と同様。(E)16の変異体DNA配列(変異は赤色)について、L13+R13 CCR5B TALENの選択からの、オンターゲットDNA(OnB)と比較した濃縮値(enrichment value)。(F)オンターゲット切断(=1)に対して正規化された、(E)にリストされた配列についての、in vitroの個別のTALEN切断効率(切断されたDNAの、全DNAに対する比率)と、オンターゲット濃縮値(=1)に対して正規化された、選択におけるそれらの濃縮値の間の対応。(G)(F)で使用されたオンターゲットおよびオフターゲット配列の、PAGEによって分析された個別アッセイ

0018

オンターゲットおよび予測されたオフターゲットゲノム部位での、TALENにより誘導された細胞修飾。(A)TALENなし、またはヘテロ二量体EL/KK、ヘテロ二量体ELD/KKR、もしくはホモ二量体(Homo)FokIバリアントを含有するCCR5A TALENのいずれかで処置した細胞について、細胞修飾率を示したものであり、該細胞修飾率は、オンターゲット部位(On)および予測オフターゲット部位(Off)について、配列の総数に相対的な、TALEN切断に整合して観察された挿入または欠失インデル)の数のパーセンテージとして示される。(B)ATMTALENについて、(A)と同様。(C)ELD/KKR FokIドメインを含むCCR5A TALENで処置した細胞について、オンターゲット部位およびオフターゲット部位での修飾された配列の例。示された各例について、未修飾のゲノム部位が最初の配列であり、続いて欠失を含有するトップ3の配列が示される。括弧内の数字はシーケンシングの数を表し、半部位は下線太字で示す。

0019

ヒトゲノムにおける、TALEN特異性およびオフターゲット部位の存在量の両方を考慮した、TALEN長の関数としての予測されたオフターゲットゲノム切断。(A)オンターゲット(ゼロ変異)および1〜6個の変異を含むオフターゲット配列の濃縮値を、様々なTALE反復アレイ長さのCCR5B TALENについて示す。TALENは、長さが32bp(L16+R16)、29bp(L16+R13またはL13+R16)、26bp(L16+R10またはL13+R13またはL10+R16)、23bp(L13+R10またはL10+R13)または20bp(L10+R10)のDNA部位を標的とした。(B)9個のCCR5Bオンターゲット配列(L10、L13、またはL16を、R10、R13、またはR16と組み合わせたもの)の各々に関連するヒトゲノム中の部位の数、これにより、2つの半部位の間に12〜25bpのスペーサー長が可能となる。(C)全9個のCCR5B TALENについて、全体的なゲノムのオフターゲット切断頻度を、一定数の変異を含むヒトゲノム中の部位の数に、(A)に示された同数の変異を含むオフターゲット配列の濃縮値を掛け合わせることにより予測した。おそらく選択感度限界により、濃縮値は高い変異数において横ばいとなるため、高い変異濃縮値は、濃縮値を変異数の関数として近似することにより、外挿する必要があった(表9)。全体的な予測のゲノム切断を、ヒトゲノムで1回より多く発生することが観測された部位の変異数についてのみ、算出した。

0020

標準または操作されたC末端ドメインを含むTALENの、in vitro特異性および個別切断効率。(AおよびB)標準、Q3、Q7、または28−aaC末端ドメインを含む(A)CCR5A TALENまたは(B)ATMTALENの選択についての、オンターゲット濃縮値。(C)CCR5Aオンターゲット配列(OnC)と小文字で示す変異を有する二重変異配列。(D)ATMオンターゲット配列(OnC)と小文字で示す変異を有する単一変異配列。(E)標準または操作されたQ7 C末端ドメインのいずれかを含むCCR5A TALENを用いた、(C)にリストされたDNA配列の、個別のin vitro切断効率。(F)ATM TALENについて、(E)と同様。

0021

ヒト細胞における操作されたTALENの特異性。標準および操作されたTALENの細胞修飾効率を、全配列からのTALEN誘導性修飾に整合するインデルのパーセンテージとして表し、これを、オンターゲットCCR5A配列および、最も高度に切断された試験されたオフターゲット基質である、CCR5Aオフターゲット部位#5について示す。オンターゲットのオフターゲット修飾に対する比率として定義される細胞特異性を、各バーの対の下に示す。

0022

ヒトCCR5およびATM遺伝子における標的DNA配列。本研究で使用するTALENのための標的DNA配列を、黒で示す。各半部位標的の5’Tを認識するN末端TALEN末端に注目し(5’)、TALENは、標的とされた塩基対の数に応じて命名される。示されたCCR5 L18とR18を標的とするTALENを、CCR5A TALENと呼び、一方、示されたL10、L13、L16、R10、R13またはR16半部位を標的とするTALENを、CCR5B TALENと呼ぶ。

0023

ヒートマップにおける、すべてのCCR5A TALENの選択からの特異性プロファイル。CCR5A TALENの選択内のすべての標的化塩基対に対する特異性スコアが示される。標的半部位における全ての位置、および単一の隣接位置における、L18+R18 CCR5A TALENについての特異性スコア。色は、最大特異性スコアの1.0〜白(スコア0、特異性なし)〜最大の負のスコアの−1.0の範囲である。枠内の塩基は、意図された標的塩基を表す。右側のタイトルは、選択に使用されるTALENが、標準TALEN構築物(これは標準C末端ドメイン、野生型N末端ドメイン、およびEL/KK FokIバリアントを含む)と異なるかどうかを示す。選択は、表2にリストされた条件に対応する。(A)標準、Q3、Q7、28−aa、32nM標準、8nM標準、4nM標準、32nM Q7、および8nM Q7のCCR5A TALEN選択の、特異性プロファイル。(B)4nM Q7、N1、N2、N3、標準ELD/KKR、Q3 ELD/KKR、Q7 ELD/KKRおよびN2 ELD/KKRのCCR5A TALEN選択の、特異性プロファイル。指定されていない場合、TALEN濃度は16nMである。

0024

すべてのCCR5A TALEN選択からの、棒グラフで表した特異性プロファイル。CCR5A TALENの選択内のすべての標的化された塩基対に対する特異性スコアが示される。正の特異性スコアは、特異性スコア1.0の完全な特異性までは、その位置での他の可能性に対する当該塩基対の濃縮を表す。負の特異性スコアは、−1.0の完全な非特異性スコアまでは、その塩基対に対する濃縮を表す。指定された位置は、X軸上に積み重ね棒グラフとしてプロットし(同一位置の複数の指定された塩基対は、短い棒を前側にして互いの上にプロットし、端から端には並べない)、一方、指定されない塩基対は、細いグループ化された棒としてプロットした。右側のタイトルは、選択に使用されるTALENが、標準TALEN構築物(これは標準C末端ドメイン、野生型N末端ドメイン、およびEL/KK FokIバリアントを含む)と異なるかどうかを示す。選択は、表2にリストされた条件に対応する。(A)標準、Q3、Q7、28−aa、32nM標準、および8nM標準のCCR5A TALEN選択の、特異性プロファイル。(B)4nM標準、32nM Q7、8nM Q7、4nM Q7、N1、およびN2のCCR5A TALEN選択の、特異性プロファイル。(C)N3、標準ELD/KKR、Q3 ELD/KKR、Q7 ELD/KKRおよびN2 ELD/KKRのCCR5A TALEN選択の、特異性プロファイル。指定されていない場合、TALEN濃度は16nMである。

0025

ヒートマップにおける、すべてのATMTALENの選択からの特異性プロファイル。ATM TALENの選択内のすべての標的化塩基対に対する特異性スコアが示される。標的半部位における全ての位置、および単一の隣接位置における、L18+R18 ATM TALENについての特異性スコア。色は、最大特異性スコアの1.0〜白(スコア0、特異性なし)〜最大の負のスコアの−1.0の範囲である。枠内の塩基は、意図された標的塩基を表す。右側のタイトルは、選択に使用されるTALENが、標準TALEN構築物(これは標準C末端ドメイン、野生型N末端ドメイン、およびEL/KK FokIバリアントを含む)と異なるかどうかを示す。選択は、表2にリストされた条件に対応する。(A)(12nM)標準、Q3、(12nM)Q7、24nM標準、6nM標準、3nM標準、24nM Q7、および6nM Q7のATM TALEN選択の、特異性プロファイル。(B)N1、N2、N3、標準ELD/KKR、Q3 ELD/KKR、Q7 ELD/KKRおよびN2 ELD/KKRのATM TALEN選択の、特異性プロファイル。指定されていない場合、TALEN濃度は12nMである。

0026

すべてのATMTALEN選択からの、棒グラフで表した特異性プロファイル。ATM TALENの選択内のすべての標的化された塩基対に対する特異性スコアが示される。正の特異性スコアは、特異性スコア1.0の完全な特異性までは、その位置での他の可能性に対する当該塩基対の濃縮を表す。負の特異性スコアは、−1.0の完全な非特異性スコアまでは、その塩基対に対する濃縮を表す。指定された位置は、X軸上に積み重ね棒グラフとしてプロットし(同一位置の複数の指定された塩基対は、短い棒を前側にして互いの上にプロットし、端から端には並べない)、一方、指定されない塩基対は、細いグループ化された棒としてプロットした。右側のタイトルは、選択に使用されるTALENが、標準TALEN構築物(これは標準C末端ドメイン、野生型N末端ドメイン、およびEL/KK FokIバリアントを含む)と異なるかどうかを示す。選択は、表2にリストされた条件に対応する。(A)標準、Q3、Q7、28−aa、32nM標準、および8nM標準のATM TALEN選択の、特異性プロファイル。(B)3nM標準、24nM Q7、6nM Q7、N1、N2およびN3のATM TALEN選択の、特異性プロファイル。(C)標準ELD/KKR、Q3 ELD/KKR、Q7 ELD/KKRおよびN2 ELD/KKRのATM TALEN選択の、特異性プロファイル。指定されていない場合、TALEN濃度は12nMである。

0027

ヒートマップにおける、すべてのCCR5B TALENの選択からの特異性プロファイル。CCR5B TALENの選択内のすべての標的化塩基対に対する特異性スコアが示される。標的半部位における全ての位置、および単一の隣接位置における、左(L10、L13、L16)および右(R10、R13、R16)半部位のすべての可能な組み合わせを標的とするCCR5B TALENについての特異性スコア。色は、最大特異性スコアの1.0〜白(スコア0、特異性なし)〜最大の負のスコアの−1.0の範囲である。枠内の塩基は、意図された標的塩基を表す。右側のタイトルは、選択に使用されるCCR5B TALENについての標的化された左(L)および右(R)標的半部位を示す。選択は、表2にリストされた条件に対応する。

0028

すべてのCCR5B TALEN選択からの、棒グラフで表した特異性プロファイル。CCR5B TALENの選択内のすべての標的化された塩基対に対する特異性スコアが示される。正の特異性スコアは、特異性スコア1.0の完全な特異性までは、その位置での他の可能性に対する当該塩基対の濃縮を表す。負の特異性スコアは、−1.0の完全な非特異性スコアまでは、その塩基対に対する濃縮を表す。指定された位置は、X軸上に積み重ね棒グラフとしてプロットし(同一位置の複数の指定された塩基対は、短い棒を前側にして互いの上にプロットし、端から端には並べない)、一方、指定されない塩基対は、細いグループ化された棒としてプロットした。右側のタイトルは、選択に使用されるCCR5B TALENについての標的化された左(L)および右(R)標的半部位を示す。選択は、表2にリストされた条件に対応する。

0029

二重変異体配列の予測された濃縮値に対する観測された濃縮値。(A)L13+R13CCR5A TALENの選択について、個別の配列の観測された二重変異体濃縮値(選択後配列の存在量÷選択前配列の存在量)を、オンターゲット濃縮値(定義により=1.0)について正規化し、オンターゲット濃縮値について正規化された成分の単一変異体の濃縮値を乗じることにより算出した予測二重変異体濃縮値に対して、プロットした。したがって予測二重変異体濃縮値は、各単一変異から二重変異体濃縮値に対して、独立した寄与を果たす。(B)観測された二重変異体配列濃縮を、予測二重変異体配列濃縮で割り算し、2つの変異の間の距離(塩基対の単位)の関数としてプロットしたもの。同一の半部位に2つの変異を有する配列のみを検討した。

0030

操作されたTALENドメインおよびTALEN濃度の、特異性に対する効果。(A)CCR5A部位の各位置での標的塩基対の特異性スコアを、標準、Q3、Q7、または28−aaC末端ドメインを含有するCCR5A TALENについて算出した。Q3、Q7、または28−aaC末端ドメインTALENの特異性スコアから、標準C末端ドメインを有するTALENの特異性スコアを引き算したものを示す。(B)操作されたN末端ドメインN1、N2、またはN3を含有するCCR5A TALENについて、(A)と同様。(C)(A)と同様だが、16nM、8nMまたは4nMにてアッセイされた標準CCR5A TALENの特異性スコアから、32nMにてアッセイされた標準CCR5A TALENの特異性スコアを引き算したものの差を比較。(D〜F)ATMTALENについて、(A〜C)と同様。選択は、表2に記載された条件に対応する。

0031

TALENのスペーサー長の選好。(A)CCR5A TALENであって、次の様々な組み合わせを含有するもの:標準、Q3、Q7、または28−aaC末端ドメイン;N1、N2、またはN3のN末端変異;および、4、8、16または32nMでのEL/KKまたはELD/KKRのFokIバリアント、による各選択に対して、DNAスペーサー長の濃縮値を、選択後配列中のDNAスペーサー長の存在量を選択前ライブラリー配列のDNAスペーサー長の存在量で割り算することにより、算出した。(B)ATMTALENについて、(A)と同様。

0032

TALENのDNA切断部位の選好。(A)CCR5A TALENであって、次の様々な組み合わせを含有するもの:標準の、Q3、Q7、または28−aaC末端ドメイン;N1、N2、またはN3のN末端変異;および、4、8、16または32nMでのEL/KKまたはELD/KKRのFokIバリアント、の各選択に対して、各可能なDNAスペーサー長についての右半部位に先行するスペーサーDNA塩基対の数のヒストグラムを、選択全体の総配列カウントに対して正規化して示す。(B)ATMTALENについて、(A)と同様。

0033

異なるアミノ酸置換を有するN末端ドメインを含むTALENの、DNA切断部位の選好。

0034

例示のTALENプラスミドコンストラクト

0035

定義
本明細書および特許請求の範囲で使用される場合、単数形「a」、「an」および「the」は、文脈が明らかに他を示さない限り、単数形と複数形の言及を含む。したがって例えば、「薬剤」への言及は、1つの薬剤および複数の薬剤を含む。

0036

本明細書で使用する用語「標準配列」は、DNA、RNA、またはアミノ酸の配列であって、その種類の知られている分子の中で各位置における塩基またはアミノ酸の最も一般的な選択を反映している前記配列を指す。例えば、タンパク質ドメイン標準アミノ酸配列は、その種類の知られている全てのドメイン、またはその種類の知られている主要なドメインの各位置に存在するアミノ酸の、最も一般的な選択を反映し得る。いくつかの態様において、標準配列はコンセンサス配列である。

0037

核酸配列の文脈において本明細書中で使用される用語「コンセンサス配列」および「コンセンサス部位」は、複数の類似の配列の各位置で見出される最も頻繁なヌクレオチド残基を表す、算出された配列を指す。典型的には、コンセンサス配列は、類似の配列が互いに比較され、類似の配列モチーフが算出される、配列アラインメントによって決定される。ヌクレアーゼ標的部位配列の文脈において、ヌクレアーゼ標的部位のコンセンサス配列は、いくつかの態様において、所与のヌクレアーゼによって最も頻繁に結合された、最も高い親和性で結合された、および/または最高の効率で切断された、配列であってよい。

0038

用語「コンジュゲートする」、「コンジュゲートされた」および「コンジュゲーション」とは、2つの実体の関連を指し、2つの実体とは例えば、2つのタンパク質などの2つの分子、2つのドメイン(例えば、結合ドメインと切断ドメイン)、またはタンパク質と薬剤(例えば、タンパク質結合ドメインと小分子)である。関連とは、例えば、直接的もしくは間接的な(例えば、リンカーを介した)共有結合を介するものか、または非共有結合性相互作用を介するものであり得る。いくつかの態様において、関連は共有結合性である。いくつかの態様において、2つの分子は、両方の分子を連結するリンカーを介してコンジュゲートされている。例えば、2つのタンパク質がお互いにコンジュゲートされて(例えば操作されたヌクレアーゼの結合ドメインと切断ドメインなど)タンパク質融合体を形成するいくつかの態様においては、2つのタンパク質は、ポリペプチドリンカーを介して、例えば、1つのタンパク質のC末端を別のタンパク質のN末端に連結するアミノ酸配列を介して、コンジュゲートされてもよい。

0039

本明細書で使用する用語「有効量」は、所望の生物学的応答を誘発するのに充分な、生物学的に活性な薬剤の量を意味する。例えば、いくつかの態様において、TALEヌクレアーゼの有効量は、例えば、無細胞アッセイにおいて、または標的細胞、組織、もしくは生物体において、ヌクレアーゼにより特異的に結合され切断される標的部位の切断を誘導するのに充分な、ヌクレアーゼの量を指してもよい。当業者によって理解されるように、薬剤、例えば、ヌクレアーゼ、ハイブリッドタンパク質、またはポリヌクレオチドの有効量は、種々の要因に応じて、例えば、所望の生物学的応答、特定のアレル、ゲノム、標的部位、細胞、または標的とされる組織、および使用される薬剤に応じて、変化し得る。

0040

本明細書で使用する用語「操作された」とは、ヒトによって設計され、生産され、製造され、合成され、および/または製作される、分子、複合体、物質、または実体を指す。したがって、操作された生成物は、自然界に存在しない生成物である。いくつかの態様において、操作された分子または複合体、例えば、操作されたTALEN単量体、二量体、または多量体は、特定の要件を満たすために、または特定の所望の特徴を有するように設計されたTALENであり、例えば、最小限のオフターゲット結合で目的の標的配列に結合するため、特定の最小または最大の切断活性を有するため、および/または特定の安定性を有するために、設計されたTALENである。

0041

本明細書中で使用される用語「単離された」とは、分子、複合体、物質、または実体であって、(1)(天然であれ、実験設定においてであれ)最初に生成された時にそれが関連していた成分の少なくともいくつかから分離されたもの、および/または(2)ヒトによって生産、製造、合成、および/または製作されたもの、を指す。単離された物質および/または実体は、最初に関連していた他の成分の、少なくとも約10%、約20%、約30%、約40%、約50%、約60%、約70%、約80%、約90%、またはそれ以上から、分離することができる。いくつかの態様において、単離された薬剤は、約80%より高く、約85%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%、または約99%より高く、純粋である。本明細書で使用される場合、物質は、それが他の成分を実質的に含まない場合に「純粋」である。

0042

核酸またはタンパク質の文脈において本明細書で使用する用語「ライブラリー」はそれぞれ、2または3以上の異なる核酸またはタンパク質の集団を指す。例えば、ヌクレアーゼ標的部位のライブラリーは、異なるヌクレアーゼ標的部位を含む少なくとも2つの核酸分子を含む。いくつかの態様において、ライブラリーは、少なくとも101、少なくとも102、少なくとも103、少なくとも104、少なくとも105、少なくとも106、少なくとも107、少なくとも108、少なくとも109、少なくとも1010、少なくとも1011、少なくとも1012、少なくとも1013、少なくとも1014、または少なくとも1015の、異なる核酸またはタンパク質を含む。いくつかの態様において、ライブラリーのメンバーランダム化配列、例えば、完全にまたは部分的にランダム化された配列を含んでよい。いくつかの態様において、ライブラリーは、互いに関連しない核酸分子を、例えば完全なランダム化配列を含む核酸を含む。他の態様において、ライブラリーの少なくともいくつかのメンバーは関連することができ、例えば、コンセンサス標的部位配列などの特定の配列のバリアントまたは誘導体であり得る。

0043

本明細書中で使用される用語「リンカー」は、2つの分子または部分、例えばヌクレアーゼの結合ドメインおよび切断ドメインを連結する、化学基または分子を指す。典型的には、リンカーは、2つの基、分子、または他の部分の、間に位置するか、またはそれらに隣接して、それぞれを共有結合を介して連結し、したがって両者を結び付ける。いくつかの態様において、リンカーはアミノ酸または複数のアミノ酸(例えば、ペプチドまたはタンパク質)である。いくつかの態様において、リンカーは、有機分子、基、ポリマー、または化学的部分である。

0044

用語「ヌクレアーゼ」は、本明細書において、例えばタンパク質または小分子などの薬剤であって、核酸分子中のヌクレオチド残基を連結するホスホジエステル結合を切断することができるものを指す。いくつかの態様において、ヌクレアーゼはタンパク質であり、例えば、核酸分子に結合でき、核酸分子内のヌクレオチド残基を連結するリン酸ジエステル結合を切断することができる、酵素である。ヌクレアーゼは、ポリヌクレオチド鎖内のホスホジエステル結合を切断するエンドヌクレアーゼ、またはポリヌクレオチド鎖の末端でホスホジエステル結合を切断するエキソヌクレアーゼであってよい。いくつかの態様において、ヌクレアーゼは、特定のヌクレオチド配列内の特定のホスホジエステル結合を結合および/または切断する、部位特異的ヌクレアーゼであり、これは本明細書において、「認識配列」、「ヌクレアーゼ標的部位」または「標的部位」とも呼ばれる。いくつかの態様において、ヌクレアーゼは一本鎖標的部位を認識し、一方他の態様において、ヌクレアーゼは、例えば二本鎖DNA標的部位などの二本鎖標的部位を認識する。多くの天然に存在するヌクレアーゼの標的部位、例えば、多くの天然に存在するDNA制限ヌクレアーゼは、当業者に知られている。多くの場合、EcoRI、HindIII、またはBamHIなどのDNAヌクレアーゼは、パリンドロームの長さ4〜10塩基対の二本鎖DNAの標的部位を認識し、2つのDNA鎖の各々を標的部位内の特定の位置で切断する。いくつかのエンドヌクレアーゼは、二本鎖核酸の標的部位を対称的に切断し、すなわち、両方の鎖を同じ位置で切断して、末端が塩基対ヌクレオチドを含むようにし、これは本明細書で平滑末端とも称される。他のエンドヌクレアーゼは、二本鎖核酸の標的部位を非対称的に切断し、すなわち、両方の鎖を異なる位置で切断して、末端が不対ヌクレオチドを含むようにする。二本鎖DNA分子の末端の不対ヌクレオチドはまた、「オーバーハング」とも呼ばれ、例えば、不対ヌクレオチド(単数または複数)がそれぞれのDNA鎖の5’または5’末端を形成するかどうかに依存して、「5’−オーバーハング」または「3’−オーバーハング」と呼ばれる。不対ヌクレオチドで終了する二本鎖DNA分子は、粘着スティッキィ)末端とも呼ばれ、何故なればそれらが、相補的な不対ヌクレオチド(単数または複数)を含む他の二本鎖DNA分子末端に粘着するからである。ヌクレアーゼタンパク質は、典型的には、タンパク質と核酸基質との相互作用を媒介する「結合ドメイン」、および核酸骨格内のホスホジエステル結合の切断を触媒する「切断ドメイン」を含む。いくつかの態様において、ヌクレアーゼタンパク質は、単量体の形態で、核酸分子に結合し切断することができ、他の態様において、ヌクレアーゼタンパク質は、標的核酸分子を切断するために、二量体化または多量体化しなければならない。天然に存在するヌクレアーゼの結合ドメインおよび切断ドメイン、ならびに特定の標的部位に結合するヌクレアーゼを生成するために組み合わせることができる、モジュラー結合ドメインおよび切断ドメインは、当業者に知られている。例えば、転写活性化因子様要素を、所望の標的部位に特異的に結合する結合ドメインとして使用し、切断ドメイン、例えばFokIの切断ドメインに融合またはコンジュゲートして、所望の標的部位を切断する操作されたヌクレアーゼを生成することができる。

0045

本明細書中で使用される用語「核酸」および「核酸分子」は、核酸塩基および酸性部分を含む化合物、例えば、ヌクレオシド、ヌクレオチド、またはヌクレオチドのポリマーを指す。典型的には、ポリマー核酸、例えば3または4以上のヌクレオチドを含む核酸分子は、隣接するヌクレオチドがホスホジエステル結合を介して互いに連結されている直鎖状分子である。いくつかの態様において、「核酸」は、個々の核酸残基(例えば、ヌクレオチドおよび/またはヌクレオシド)を指す。いくつかの態様において、「核酸」は、3または4以上の個々のヌクレオチド残基を含むオリゴヌクレオチド鎖を指す。本明細書で使用する場合、用語「オリゴヌクレオチド」および「ポリヌクレオチド」は、ヌクレオチドのポリマー(例えば、少なくとも3つのヌクレオチドのストリング)を指すために互換的に使用することができる。いくつかの態様において、「核酸」は、RNAならびに一本鎖および/または二本鎖DNAを包含する。核酸は、天然に存在するものであってよく、例えばゲノムの文脈において、転写産物mRNAtRNArRNA、siRNA、snRNA、プラスミド、コスミド染色体染色分体、または他の天然に存在する核酸分子である。一方、核酸分子は非天然分子であってもよく、例えば組換えDNAまたはRNA、人工染色体、操作されたゲノム、またはそれらの断片、または合成DNA、RNA、DNA/RNAハイブリッド、または非天然のヌクレオチドまたはヌクレオシドを含む。さらに、用語「核酸」、「DNA」、「RNA」および/または類似の用語は、核酸アナログ、すなわちホスホジエステル骨格以外を有する類似体を含む。核酸は、天然源から精製される、組換え発現系を用いて生産されて任意に精製される、化学的に合成される、などが可能である。適切な場合、例えば化学的に合成された分子の場合、核酸は、化学的に修飾された塩基または糖、および骨格修飾を有する類似体などの、ヌクレオシド類似体を含むことができる。特に断らない限り、核酸配列は、5’から3’方向に表される。いくつかの態様において、核酸は、以下であるか、またはこれを含む:天然のヌクレオシド(例えばアデノシンチミジングアノシンシチジンウリジンデオキシアデノシンデオキシチミジンデオキシグアノシン、およびデオキシシチジン);ヌクレオシド類似体(例えば、2−アミノアデノシン、2−チオチミジン、イノシンピロロピリミジン、3−メチルアデノシン、5−メチルシチジン、2−アミノアデノシン、C5−ブロモウリジン、C5−フルオロウリジン、C5−ヨードウリジン、C5−プロピニルウリジン、C5−プロピニル−シチジン、C5−メチルシチジン、2−アミノアデノシン、7−デアザアデノシン、7−デアザグアノシン、8−オキソアデノシン、8−オキソグアノシン、O(6)−メチルグアニン、および2−チオシチジン);化学的修飾塩基生物学的修飾塩基(例えば、メチル化塩基);挿入(intercalated)塩基;修飾糖(例えば、2’−フルオロリボース、リボース、2’−デオキシリボースアラビノース、およびヘキソース);および/または修飾リン酸基(例えば、ホスホロチオエートおよび5’−N−ホスホロアミダイト結合)。

0046

本明細書で使用する用語「医薬組成物」は、疾患または障害の処置の文脈において、対象に投与することができる組成物を指す。いくつかの態様において、医薬組成物は、活性成分、例えば、ヌクレアーゼまたはヌクレアーゼをコードする核酸、および薬学的に許容し得る賦形剤を含む。
用語「予防」または「予防する」とは、疾患、障害、または症状を発症するリスクのある対象(例えば、対照対象または対象の対照群と比較してリスクが上昇したか、年齢適合および/または性別を適合させた対象の平均的なリスクと比較して、リスクが高い)に対する予防的処置であって、対象が疾患、障害、または症状を発症する確率の低下(予防なしの確率と比較して)をもたらすものを指すか、および/または、既に確立された障害のさらなる進行の抑制を指す。

0047

本明細書で使用する用語「増殖性疾患」は、細胞または組織の恒常性が妨げられて、細胞または細胞集団が異常に高い増殖速度を示す、任意の疾患を指す。増殖性疾患は、前新生物過形成状態および新生物疾患などの、過剰増殖性疾患を含む。新生物疾患は、細胞の異常増殖を特徴とし、良性および悪性両方の新生物を含む。悪性新生物はまた、がんとも呼ぶ。

0048

用語「タンパク質」、「ペプチド」および「ポリペプチド」は、本明細書中で交換可能に使用され、ペプチド(アミド)結合によって一緒に連結されたアミノ酸残基のポリマーを指す。この用語は、任意のサイズ、構造、または機能のタンパク質、ペプチド、またはポリペプチドを指す。典型的には、タンパク質、ペプチド、またはポリペプチドは、少なくとも3個のアミノ酸長である。タンパク質、ペプチド、またはポリペプチドは、個々のタンパク質またはタンパク質の集合を指してもよい。タンパク質、ペプチド、またはポリペプチド中の1または2以上のアミノ酸は、例えば炭水化物基、ヒドロキシル基、リン酸基、ファルネシル基、イソファルネシル基、脂肪酸基、およびコンジュゲーション用、官能化用、もしくは他の修飾用のリンカーなどの、化学的実体を添加することによって、修飾されてもよい。タンパク質、ペプチド、またはポリペプチドはまた、単一の分子であってもよく、または多分子複合体であってもよい。タンパク質、ペプチド、またはポリペプチドは、天然に存在するタンパク質またはペプチドのほんの断片であってもよい。タンパク質、ペプチド、またはポリペプチドは、天然の、組換えの、もしくは合成のもの、またはそれらの任意の組み合わせであってもよい。タンパク質は、例えば、核酸結合ドメインおよび核酸切断ドメインなどの、異なるドメインを含んでもよい。いくつかの態様において、タンパク質は、タンパク質性部分、例えば核酸結合ドメインを構成するアミノ酸配列、および有機化合物、例えば核酸切断剤として作用し得る化合物、を含む。

0049

核酸配列の文脈において本明細書で使用する用語「ランダム化」は、遊離ヌクレオチドの混合物を組み込むために、例えば、4つすべてのヌクレオチドA、T、GおよびCの混合物を組み込むために合成された配列内の、配列または残基を指す。ランダム化残基は、典型的には、ヌクレオチド配列内の文字Nによって表される。いくつかの態様において、ランダム化配列または残基は完全にランダム化され、この場合、ランダム化残基を、それぞれの配列残基の合成ステップの間に同量の組み込まれるべきヌクレオチドを添加することによって(例えば、25%のT、25%のA、25%のG、および25%のC)、合成する。いくつかの態様において、ランダム化配列または残基は部分的にランダム化され、この場合、ランダム化残基を、それぞれの配列残基の合成ステップの間に異なる量の組み込まれるべきヌクレオチドを添加することによって(例えば、79%のT、7%のA、7%のG、および7%のC)、合成する。部分的なランダム化は、与えられた配列を鋳型とするが、所望の頻度で変異が組み込まれる配列の生成を可能にする。例えば、周知のヌクレアーゼ標的部位を合成の鋳型として使用する場合、各ステップにおいてそれぞれの残基で表されるヌクレオチドを79%で合成に添加し、残りの3つのヌクレオチドをそれぞれ7%ずつ添加する部分的ランダム化は、合成され部分的にランダム化された標的部位の混合物をもたらし、これは依然として元の標的部位のコンセンサス配列を表すが、元の標的部位とは、各残基において、合成された各残基の統計的頻度が21%で異なっている(二項分布)。いくつかの態様において、部分的ランダム化配列は、平均して5%以上、10%以上、15%以上、20%以上、25%以上、または30%以上の二項分布により、コンセンサス配列とは異なる。いくつかの態様において、部分的ランダム化配列は、平均して10%未満、15%未満、20%未満、25%未満、30%未満、40%未満、または50%未満の二項分布により、コンセンサス配列とは異なる。

0050

本明細書において用語「対象」とは、例えば個々の哺乳類などの、個々の生物を指す。いくつかの態様において、対象は、いずれかの性別で発達の任意の段階におけるヒトである。いくつかの態様において、対象は、非ヒト哺乳動物である。いくつかの態様において、対象は、非ヒト霊長類である。いくつかの態様において、対象は、齧歯類である。いくつかの態様において、対象は、ヒツジヤギウシネコ、またはイヌである。いくつかの態様において、対象は、脊椎動物両生類爬虫類魚類昆虫ハエ、または線虫である。

0051

ヌクレアーゼの文脈において本明細書中で使用される用語「標的核酸」および「標的ゲノム」は、それぞれ、与えられたヌクレアーゼの少なくとも1つの標的部位を含む核酸分子またはゲノムを指す。

0052

本明細書中で交換可能に使用される「標的部位」および「ヌクレアーゼ標的部位」は、ヌクレアーゼによって結合され切断される、核酸分子内の配列を指す。標的部位は、一本鎖または二本鎖であってもよい。二量体化するヌクレアーゼ、例えばFokI DNA切断ドメインを含むヌクレアーゼの文脈において、標的部位は、典型的には、左半部位(ヌクレアーゼの1つの単量体によって結合される)、右半部位(ヌクレアーゼの第2の単量体によって結合される)、および切断が行われる半分部位の間のスペーサー配列を含む。この構造([左半部位]−[スペーサー配列]−[右半部位])は本明細書において、LSR構造と呼ぶ。いくつかの態様において、左半部位および/または右半部位は、10〜18のヌクレオチド長である。いくつかの態様において、一方または両方の半部位は、より短いかまたはより長い。いくつかの態様において、左右の半部位は、異なる核酸配列を含む。

0053

本明細書で使用する用語「転写活性化因子様エフェクター(TALE)」とは、高度に可変な2アミノ酸モチーフ(反復可変二残基、RVF)を含む高度に保存された33〜34のアミノ酸配列を含むDNA結合ドメインを含む、タンパク質を指す。RVDモチーフは、核酸配列に対する結合特異性を決定し、当業者に周知の方法に従って、所望のDNA配列に特異的に結合するよう、操作することができる。(例えば、以下を参照:Miller, Jeffrey; et.al. (February 2011). “A TALE nuclease architecture for efficient genome editing”. Nature Biotechnology 29 (2): 143-8;Zhang, Feng; et.al. (February 2011). ”Efficient construction of sequence-specific TAL effectors for modulating mammalian transcription”. Nature Biotechnology 29 (2): 149-53;Geiβler, R.; Scholze, H.; Hahn, S.; Streubel, J.; Bonas, U.; Behrens, S. E.; Boch, J. (2011), Shiu, Shin-Han. ed. “Transcriptional Activators of Human Genes with Programmable DNA-Specificity”.PLoS ONE 6 (5): e19509;Boch, Jens (February 2011). “TALEs of genome targeting”. Nature Biotechnology 29 (2): 135-6;Boch, Jens; et.al. (December 2009). “Breaking the Code of DNA Binding Specificity of TAL-Type III Effectors”. Science 326 (5959): 1509-12;およびMoscou, Matthew J.; Adam J. Bogdanove (December 2009). “A SimpleCipher Governs DNA Recognition by TAL Effectors”. Science 326 (5959): 1501;これらの各々の全内容は、参照により本明細書に組み込まれる)。アミノ酸配列とDNA認識との間の単純な関係は、適切なRVDを含有する反復セグメントの組み合わせを選択することにより、特定のDNA結合ドメインの操作を可能にした。

0054

本明細書で使用する用語「転写活性化因子様要素ヌクレアーゼ」(TALEN)は、例えばFokIドメインなどのDNA切断ドメインに対する、転写活性化因子様エフェクターDNA結合ドメインを含む、人工的ヌクレアーゼを指す。操作されたTALEコンストラクトを生成するための、多くのモジュールアセンブリスキーム報告されている(Zhang, Feng; et.al. (February 2011). ”Efficient construction of sequence-specific TAL effectors for modulating mammalian transcription”. Nature Biotechnology 29 (2): 149-53;Geiβler, R.; Scholze, H.; Hahn, S.; Streubel, J.; Bonas, U.; Behrens, S. E.; Boch, J. (2011), Shiu, Shin-Han. ed. “Transcriptional Activators of Human Genes with Programmable DNA-Specificity”.PLoS ONE 6 (5): e19509;Cermak, T.; Doyle, E. L.; Christian, M.; Wang, L.; Zhang, Y.; Schmidt, C.; Baller, J. A.; Somia, N. V. et al. (2011). “Efficient design and assembly of custom TALEN andotherTAL effector-based constructs for DNA targeting”. Nucleic AcidsResearch;Morbitzer, R.; Elsaesser, J.; Hausner, J.; Lahaye, T. (2011). “Assembly of custom TALE-type DNA binding domains by modular cloning”. Nucleic Acids Research;Li, T.; Huang, S.; Zhao, X.; Wright, D. A.; Carpenter, S.; Spalding, M. H.; Weeks, D. P.; Yang, B. (2011). “Modularly assembled designer TAL effector nucleases for targeted gene knockout and gene replacement in eukaryotes”. Nucleic Acids Research.;Weber, E.; Gruetzner, R.; Werner, S.; Engler, C.; Marillonnet, S. (2011). Bendahmane, Mohammed. ed. “Assembly of Designer TAL Effectors by Golden Gate Cloning”. PLoS ONE 6 (5): e19722;これらの各々の全内容は、参照により本明細書に組み込まれる)。

0055

用語「処置」、「処置する」および「処置すること」とは、本明細書に記載のように、疾患または障害、またはその1または2以上の症状の、発症を逆転、緩和または遅延させる、またはその進行を阻害するための、臨床的介入を指す。本明細書において、用語「処置」、「処置する」および「処置すること」とは、本明細書に記載のように、疾患または障害、またはその1または2以上の症状の、発症を逆転、緩和または遅延させる、またはその進行を阻害するための、臨床的介入を指す。いくつかの態様において、処置は、1または2以上の症状が発症した後、および/または疾患が診断された後に行ってもよい。他の態様において、処置は、症状の不在下で、例えば、症状の発症を予防または遅延させるため、または疾患の発症または進行を阻害するために行ってもよい。例えば、処置は、感受性の高い個人に対して、症状の発症前に行ってもよい(例えば、症状の履歴に照らして、および/または遺伝的または他の感受性因子に照らして)。処置はまた、症状が解消した後に、例えばその再発を予防または遅延させるために、継続してもよい。

0056

本発明の特定の態様の詳細な説明
転写活性化因子様エフェクターヌクレアーゼ(TALEN)は、FokI制限エンドヌクレアーゼの切断ドメインと、DNA結合転写活性化因子様エフェクター(TALE)反復アレイとの融合体である。TALENは、オフターゲット切断活性を低減し、したがって標的DNA配列に特異的に結合するように操作することができ、例えばゲノム内、in vitroまたはin vivoで標的DNA配列を切断するために使用することができる。かかる操作されたTALENは、in vivoまたはin vitroでゲノムを操作するために使用することができ、例えば標的ゲノム部位でのDNA切断の誘導を介した遺伝子ノックアウトまたはノックインのために、非相同末端結合(NHEJ)を介した標的遺伝子ノックアウトのため、または外来DNA鋳型を使用した相同性配向型修復(HDR)を介した標的ゲノム配列置換のために、使用できる。

0057

TALENは、天然および合成配列を含む任意の所望の標的DNA配列を切断するように、設計することができる。しかし、密接に関連するオフターゲット配列から標的配列を区別するTALENの能力は、深く研究されていなかった。この能力およびそれに影響を与えるパラメータを理解することは、その治療的使用のために所望の特異性レベルを有するTALENの設計に、およびまた、オフターゲット切断の可能性を最小化する目的で切断すべきユニークな標的配列を選択するために、重要である。

0058

本開示のいくつかの側面は、1012の潜在的なオフターゲット部位でのin vitro選択およびハイスループットシーケンシングによる、41のTALENのプロファイリングから得られた切断特異性データに基づく。選択結果のコンピューター分析は、ヒトゲノムにおけるオフターゲット基質を予測し、そのうち13は、ヒト細胞においてTALENにより修飾された。本開示のいくつかの側面は、次の驚くべき知見に基づく:(i)TALEN反復は、比較的独立してDNAに結合する;(ii)より長いTALENは、ミスマッチにより寛容であるが、ゲノムの場面でより特異的である;および(iii)過剰なDNA結合エネルギーは、TALEN特異性の低減につながり得る。これらの知見に基づき、最適化されたTALENを、非特異的DNA結合を減少させるために設計された変異を用いて操作した。これらの操作されたTALENのいくつかは、ヒト細胞において一般的に使用されるTALENと比較して、例えば34〜>116倍高い改善された特異性を示す。

0059

ゲノム中に部位特異的な変化を操作する能力は、重要な治療的意味を持つ強力な研究能力を表す。TALENは、FokI制限エンドヌクレアーゼ切断ドメインとDNA結合TALE反復アレイの融合体である(図1A)。これらのアレイは、各々が位置12と13のアミノ酸である反復可変二残基(RVD)を使用して単一のDNAヌクレオチドを認識する、複数の34アミノ酸TALE反復配列からなる1,2。4つのDNA塩基対の各々を認識可能なRVDの例が知られており、事実上任意のDNA配列に結合することができるTALE反復のアレイの構築を可能とする。TALENは、真正のヘテロ二量体FokIバリアントの使用を介して、ヘテロ二量体としてのみ活性であるように操作可能である3、4。この構成において、2つの異なるTALEN単量体はそれぞれが、1つの標的半部位に結合して2つの半部位の間のDNAスペーサー配列内で切断するように、設計される。

0060

例えば哺乳動物細胞などの細胞において、TALENによって誘導される二重鎖切断は、非相同末端結合(NHEJ)を介した標的遺伝子ノックアウト5、または、外来DNA鋳型を使用し相同性配向型修復(HDR)を介した標的ゲノム配列置換6,7をもたらすことができる。TALENは、種々の生物8−11および細胞株7,12,13においてゲノムを操作するために、首尾良く使用されている。

0061

オフターゲット部位でのTALEN媒介性のDNA切断は、ゲノム座位での意図しない変異をもたらし得る。SELEX実験は、単量体TALEタンパク質のDNA結合特異性を特徴付けたが5,7、活性な二量体ヌクレアーゼのDNA切断特異性は、それらの成分の単量体DNA結合ドメインの特異性とは異なる可能性がある14。TALENで処置した4つの酵母株15および、TALENで処置した細胞由来の2つのヒト細胞株16の全ゲノムシーケンシングは、TALE誘発性のゲノムオフターゲット変異の証拠がないことを明らかにし、これは、アフリカツメガエル(Xenopus)17およびヒト細胞株18におけるオフターゲットゲノム修飾が観察されないとの他の報告と整合する。対照的に、TALENは、ゼブラフィッシュ13,19、ラット9、ヒト初代線維芽細胞20および胚性幹細胞7でのin vivoのオンターゲット配列と比較して、2〜11個の変異を含むオフターゲット部位を切断することが観察された。関連する変異標的部位の大規模なセットでのTALEN切断の測定値から生成される、TALENの特異性の系統的および包括的プロファイルは、これまで記載されていない。かかる広い特異性プロファイルは、研究ツールおよび治療剤としてのTALENの可能性を理解し、改善するための、基本である。

0062

本明細書に記載される研究の一部は、DNA切断特異性のために以前に記載されたin vitro選択14の修正版を使用した、41のTALEN対の能力であって、それらの標的配列の各々の1012のオフターゲットバリアントを切断する前記能力をプロファイルするために行った実験に関する。これらの実験からのこれらの結果は、TALEN切断特異性の総合的なプロファイルを提供する。in vitroでの選択結果を使用して、ヒトゲノムにおけるオフターゲット基質をコンピューターにより予測し、これらのうち13個が、ヒト細胞においてTALENによって切断されることが確認された。

0063

驚くべきことに、塩基対当たりより少なく特異的であるにも関わらず、より長い標的部位を切断するように設計されたTALENは、ヒトゲノムにおける潜在的なオフターゲット部位の数を考慮した場合、より短い部位を標的とするものよりも一般に全体として高い特異性を示すことが判明した。選択結果はまた、過剰な非特異的TALEN結合エネルギーが、オンターゲットの切断に比べてより大きいオフターゲット切断を生じるというモデル示唆する。このモデルに基づき、我々は、現在使用されているTALENコンストラクトよりも、in vitroで実質的に改善されたDNA切断特異性を有し、ヒト細胞において30〜>150倍高い特異性を有するTALENを操作した。

0064

本開示のいくつかの側面は、本明細書の別の箇所でより詳細に説明するように、3つの異なる配列の1つを標的とするように設計された41のヘテロ二量体TALENの特異性のプロファイリングから得られたデータに基づく。プロファイリングは、in vitro選択法14の改善版(PCT出願公開WO2013/066438 A2にも記載されており、この全内容は参照により本明細書に組み込まれる)を、選択のスループット感度を高める修飾を加えて実施した(図1B)。

0065

簡単に述べると、TALENは、>1012のDNA配列のライブラリーに対してプロファイリングされ、切断産物捕捉し分析して、各TALENの特異性およびオフターゲット活性を決定した。選択データは、in vitroでのオフターゲットTALEN切断の効率を正確に予測し、またTALENが、標的配列全体を通して全体的に高度に特異的であることを示したが、従来のTALENではオフターゲット切断のいくつかのレベルが生じ、これは、TALEN使用のいくつかのシナリオにおいては望ましくない場合がある。本明細書に記載した実験の結果、驚くべきことに、TALE反復がそれらのそれぞれのDNA塩基対に、隣接するミスマッチに対するわずかに増加した許容範囲を超えて、独立して結合することが見出され、これは、塩基対当たりのTALEN特異性が、標的部位の長さとは無関係であるという認識を知らしめた。本明細書の別の箇所でより詳細に説明するように、短いTALENは長いTALENよりも、標的塩基対当たり大きい特異性を有するが、しかし、長いTALENは短いTALENよりも、20〜32bpの部位を標的とする試験されたTALEN長については、全ゲノムの場面における潜在的な切断部位のセットに対してより特異的であることが、実験的に検証された。

0066

本開示のいくつかの側面は、長いTALEN中の過剰な結合エネルギーが、対応するオンターゲット切断効率の効率増加なしでオフターゲット配列の切断を可能にすることにより、特異性を減少させるという、驚くべき発見に基づく。本開示のいくつかの側面は、TALENが、オンターゲット切断効率を損なうことなく、オフターゲット結合エネルギー低減することによって、それらの標的配列をより特異的に切断するように操作することができるという、驚くべき発見に基づく。TALEN特異性が、効率的なオンターゲット切断を可能とするために必要とされるものを越えて、非特異的DNA結合エネルギーを低減することにより、改善可能であるとの認識は、改善された標的部位特異性を有する操作されたTALENを生成するための基礎となる。

0067

典型的には、TALEN単量体、例えば本明細書で提供されるTALEN単量体は、次の構造を含むか、または次の構造のものである:
[N末端ドメイン]−[TALE反復アレイ]−[C末端ドメイン]−[ヌクレアーゼドメイン]
式中、各「−」は個別に、共有結合または非共有結合的なコンジュゲーションを示し、および式中、コンジュゲーションは、例えば直接結合を介して直接的であっても、または例えばリンカードメインを介して間接的であってもよい。図1も参照されたい。

0068

本開示のいくつかの側面は、以前に使用されたTALENに比べて、強化された特異性を有するTALENを提供する。一般に、TALENの配列特異性は、特定のヌクレオチド配列に結合するTALE反復アレイによって付与される。TALE反復アレイは複数の34アミノ酸TALE反復配列からなり、その各々は、位置12と13のアミノ酸である反復可変二残基(RVD)を使用して、1つのDNAヌクレオチドを認識する。本開示のいくつかの側面は、TALE反復アレイの特異的結合が、二量体化および核酸切断のために充分であること、および、非特異的核酸結合活性が、TALENのN末端および/またはC末端ドメインに起因することを、提供する。

0069

この認識に基づき、改善されたTALENが本明細書に提供されるように操作される。N末端ドメインを介した非特異的結合が、生理的pHで正に荷電した(カチオン性)アミノ酸残基によって付与される過剰な結合エネルギーを介して、発生し得ることが発見されたので、本明細書で提供される改善されたTALENの一部は、標準TALENと比較して、減少した正味電荷および/またはそれらの標的核酸配列に結合するための減少した結合エネルギーを有する。この電荷の減少は、修飾N末端およびC末端ドメインを介した、オフターゲット結合の減少につながる。したがって標的認識および結合の一部は、TALE反復アレイの特異的認識および結合活性により狭く限定される。得られたTALENは、したがって、非修飾ドメインを使用するTALENと比較して、結合の特異性の増加および、次に、改善されたTALENによる標的部位の切断の特異性の増加を示す。

0070

いくつかの態様において、N末端ドメインの正味電荷が標準N末端ドメイン(配列番号1)の正味電荷より少ないTALEN;および/またはC末端ドメインの正味電荷が、標準C末端ドメイン(配列番号22)の正味電荷より少ないTALENが、提供される。いくつかの態様において、N末端ドメインの標的核酸分子への結合エネルギーが、標準N末端ドメイン(配列番号1)の結合エネルギーより少ないTALEN、および/またはC末端ドメインの標的核酸分子への結合エネルギーが、標準C末端ドメイン(配列番号22)の結合エネルギーより少ないTALENが、提供される。いくつかの態様において、修飾TALENのN末端ドメインであって、TALEN標的核酸分子へのその結合エネルギーが、標準N末端ドメイン(配列番号1)の結合エネルギーより少ないものが、提供される。いくつかの態様において、修飾TALENのC末端ドメインであって、TALEN標的核酸分子へのその結合エネルギーが、標準C末端ドメイン(配列番号22)の結合エネルギーより少ないものが、提供される。いくつかの態様において、提供されるTALENにおけるN末端および/またはC末端ドメインの結合エネルギーは、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、または少なくとも99%、低減されている。

0071

いくつかの態様において、標準N末端ドメインおよび/または標準C末端ドメインは、生理的pHで正に荷電したアミノ酸残基を、荷電していないかまたは負に荷電したアミノ酸残基で置き換えるように、修飾される。いくつかの態様において、修飾は、正に荷電した残基の、負に荷電した残基による置き換えを含む。いくつかの態様において、修飾は、正に荷電した残基の、中性(非荷電)残基による置き換えを含む。いくつかの態様において、修飾は、正に荷電した残基の、電荷を有さないかまたは負電荷を有する残基による置換を含む。いくつかの態様において、修飾N末端ドメインおよび/または修飾C末端ドメインの正味電荷は、+10以下、+9以下、+8以下、+7以下、+6以下、+5以下、+4以下、+3以下、+2以下、+1以下、0以下、−1以下、−2以下、−3以下、−4以下、−5以下、または−10以下である。いくつかの態様において、修飾N末端ドメインおよび/または修飾C末端ドメインの正味電荷は、+5〜−5の間、+2〜−7の間、0〜−5の間、0〜−10の間、−1〜−10の間、または−2〜−15の間である。いくつかの態様において、修飾N末端ドメインおよび/または修飾C末端ドメインの正味電荷は、負である。いくつかの態様において、修飾N末端ドメインおよび修飾C末端ドメインの正味電荷は、共に負である。いくつかの態様において、修飾N末端ドメインおよび修飾C末端ドメインの正味電荷は、中性またはわずかに正である(例えば、+2未満または+1未満)。いくつかの態様において、修飾N末端ドメインおよび修飾C末端ドメインの正味電荷は、共に、中性またはわずかに正である(例えば、+2未満または+1未満)。

0072

いくつかの態様において、修飾N末端ドメインおよび/または修飾C末端ドメインは、標準ドメイン配列の少なくとも1つのカチオン性アミノ酸残基が、生理的pHで電荷を示さないかまたは負電荷を示すアミノ酸残基で置き換えられている点で、それぞれの標準ドメイン配列とは異なっているアミノ酸配列を含む。いくつかの態様において、修飾N末端ドメインおよび/または修飾C末端ドメインにおいて、少なくとも1個の、少なくとも2個の、少なくとも3個の、少なくとも4個の、少なくとも5個の、少なくとも6個の、少なくとも7個の、少なくとも8個の、少なくとも9個の、少なくとも10個の、少なくとも11個の、少なくとも12個の、少なくとも13個の、少なくとも14個の、または少なくとも15個のカチオン性アミノ酸は、生理的pHで電荷を示さないかまたは負電荷を示すアミノ酸残基で置き換えられている。いくつかの態様において、修飾N末端ドメインおよび/または修飾C末端ドメインにおいて、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15個のカチオン性アミノ酸は、生理的pHで電荷を示さないかまたは負電荷を示すアミノ酸残基で置き換えられている。

0073

いくつかの態様において、カチオン性アミノ酸残基は、アルギニン(R)、リジン(K)、またはヒスチジン(H)である。いくつかの態様において、カチオン性アミノ酸残基は、RまたはHである。いくつかの態様において、生理的pHで電荷を示さないかまたは負電荷を示すアミノ酸残基は、グルタミン(Q)、グリシン(G)、アスパラギン(N)、スレオニン(T)、セリン(S)、アスパラギン酸(D)またはグルタミン酸(E)である。いくつかの態様において、生理的pHで電荷を示さないかまたは負電荷を示すアミノ酸残基は、Qである。いくつかの態様において、修飾N末端ドメインおよび/または修飾C末端ドメインにおいて、少なくとも1つのリジンまたはアルギニン残基は、グルタミン残基で置き換えられている。

0074

いくつかの態様において、C末端ドメインは、次のアミノ酸置換の1または2以上を含む:K777Q、K778Q、K788Q、R789Q、R792Q、R793Q、R801Q。いくつかの態様において、C末端ドメインは、次のアミノ酸置換の2または3以上を含む:K777Q、K778Q、K788Q、R789Q、R792Q、R793Q、R801Q。いくつかの態様において、C末端ドメインは、次のアミノ酸置換の3または4以上を含む:K777Q、K778Q、K788Q、R789Q、R792Q、R793Q、R801Q。いくつかの態様において、C末端ドメインは、次のアミノ酸置換の4または5以上を含む:K777Q、K778Q、K788Q、R789Q、R792Q、R793Q、R801Q。いくつかの態様において、C末端ドメインは、次のアミノ酸置換の5または6以上を含む:K777Q、K778Q、K788Q、R789Q、R792Q、R793Q、R801Q。いくつかの態様において、C末端ドメインは、次のアミノ酸置換の6または7以上を含む:K777Q、K778Q、K788Q、R789Q、R792Q、R793Q、R801Q。いくつかの態様において、C末端ドメインは、次のアミノ酸置換の全7つを含む:K777Q、K778Q、K788Q、R789Q、R792Q、R793Q、R801Q。いくつかの態様において、C末端ドメインは、Q3バリアント配列(K788Q、R792Q、R801Q、配列番号23参照)を含む。いくつかの態様において、C末端ドメインは、Q7バリアント配列(K777Q、K778Q、K788Q、R789Q、R792Q、R793Q、R801Q、配列番号24参照)を含む。

0075

いくつかの態様において、N末端ドメインは、標準N末端ドメインのトランケート型である。いくつかの態様において、C末端ドメインは、標準C末端ドメインのトランケート型である。いくつかの態様において、トランケートされたN末端ドメインおよび/またはトランケートされたC末端ドメインは、標準ドメインの残基の90%未満、80%未満、70%未満、60%未満、50%未満、40%未満、30%未満、または25%未満を含む。いくつかの態様において、トランケートされたC末端ドメインは、60個未満、50個未満、40個未満、30個未満、29個未満、28個未満、27個未満、26個未満、25個未満、24個未満、23個未満、22個未満、21個未満、または20個のアミノ酸残基を含む。いくつかの態様において、トランケートされたC末端ドメインは、60、59、58、57、56、55、54、53、52、51、50、49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、または10個の残基を含む。いくつかの態様において、修飾N末端ドメインおよび/または修飾C末端ドメインはトランケートされており、1または2以上のアミノ酸置換を含む。当業者には、いくつかの態様においては、トランケートを収容するために、例えばトランケートされたC末端ドメインなどのトランケートされたドメインを使用してTALENにおけるDNAスペーサー長を調整することが望ましいことが明らかであろう。

0076

いくつかの態様において、核酸切断ドメインと呼ばれることもあるヌクレアーゼドメインは、非特異的な切断ドメイン、例えば、FokIヌクレアーゼドメインである。いくつかの態様において、ヌクレアーゼドメインは単量体であり、核酸を切断するために、二量体化または多量体化しなければならない。TALEN単量体の、ホモまたはヘテロ二量体化または多量体化は、典型的には、単量体の、二量体化を可能にするのに充分近接している結合配列への、例えば、同一の核酸分子(例えば同一の二本鎖核酸分子)上で互いに近接している配列への結合を介して、生じる。

0077

最も一般的に使用されるドメイン、例えば、最も広く使用されるN末端およびC末端ドメインは、本明細書において標準ドメインと呼ぶ。標準N末端ドメインの例示的な配列(配列番号1)および標準C末端ドメインの例示的な配列(配列番号22)が、本明細書中に提供される。FokIヌクレアーゼドメインの典型的な配列も、本明細書中に提供される。さらに、CCR5結合TALE反復アレイを形成する、TALE反復の例示的な配列が提供される。以下に提供される配列は例示的であり、本開示に包含されるいくつかの態様を説明する目的のために提供されることが、理解されるであろう。これらは限定的であることを意味せず、本開示の側面に従って有用である追加の配列は、この開示に基づいて当業者には明らかであろう。

0078

標準N末端ドメイン:

0079

修飾N末端ドメイン:N1

0080

修飾N末端ドメイン:N2

0081

修飾N末端ドメイン:N3

0082

TALE反復アレイ:L18CCR5A

0083

標準C末端ドメイン:

0084

修飾C末端ドメイン:Q3

0085

修飾C末端ドメイン:Q7

0086

修飾C末端ドメイン:28−aa

0087

FokI:ホモ二量体

0088

FokI:EL

0089

FokI:KK

0090

FokI:ELD

0091

FokI:KKR

0092

いくつかの態様において、標準N末端ドメイン、TALE反復アレイ、修飾C末端ドメイン、およびヌクレアーゼドメインを含むTALENが、本明細書に提供される。いくつかの態様において、修飾N末端ドメイン、TALE反復アレイ、標準C末端ドメイン、およびヌクレアーゼドメインを含むTALENが、本明細書に提供される。いくつかの態様において、修飾N末端ドメイン、TALE反復アレイ、修飾C末端ドメイン、およびヌクレアーゼドメインを含むTALENが、本明細書に提供される。いくつかの態様において、ヌクレアーゼドメインは、FokIヌクレアーゼドメインである。いくつかの態様において、FokIヌクレアーゼドメインは、ホモ二量体FokIドメイン、またはFokI−EL、FokI−KK、FokI−ELD、もしくはFokI−KKRドメインである。

0093

本明細書に提供される標準および修飾ドメインの特定の配列の全ての可能な組み合わせは、本開示によって包含され、以下を含む。









表1:本開示に包含される例示のTALEN。使用されるそれぞれのTALE反復アレイは、具体的な標的配列に依存する。当業者は、かかる配列特異的なTALE反復アレイを、本開示および当該技術分野の知識に基づいて設計することができるであろう。異なるN末端、C末端、およびヌクレアーゼドメインに対する配列は、上に提供されている(配列番号1〜4および22〜30参照)。

0094

当業者は、本明細書で提供される例示的な配列は、単に説明目的のためであり、本開示の範囲の限定を意図しないことを理解するであろう。本開示はまた、本発明のTALENドメイン、例えば本明細書に記載の修飾されたN末端ドメイン、C末端ドメイン、およびヌクレアーゼドメインの、他のTALEN配列の場面における、例えば他の修飾または非修飾TALEN構造における使用も包含する。本開示の側面に従って有用な、記載の原理およびパラメータを満足する追加の配列は、当業者には明らかであろう。

0095

いくつかの態様において、提供されるTALENは、単量体である。いくつかの態様において、TALEN単量体は、別のTALEN単量体と二量体化してTALEN二量体を形成することができる。いくつかの態様において形成された二量体は、ホモ二量体である。いくつかの態様において、二量体はヘテロ二量体である。

0096

いくつかの態様において、本明細書で提供されるTALENは、その標的部位を高い特異性で切断する。例えば、いくつかの態様において、ゲノム内の所望の標的部位を切断し、かつ一方で、ヌクレアーゼがその意図される標的部位を切断するのに有効な濃度において、1未満、2未満、3未満、4未満、5未満、6未満、7未満、8未満、9未満、または10未満のオフターゲット部位に結合および/または切断するように操作された、改善されたTALENが提供される。いくつかの態様において、ゲノム内の任意の他の部位とは、少なくとも3個、少なくとも4個、少なくとも5個、少なくとも6個、少なくとも7個、少なくとも8個、少なくとも9個、または少なくとも10個のヌクレオチド残基で異なるように選択された所望のユニークな標的部位を切断するように操作されたTALENが、提供される。

0097

本開示のいくつかの側面は、本明細書に提供されるTALENをコードする核酸を提供する。例えば、表1に記載のTALENをコードする核酸が、本明細書で提供される。いくつかの態様において、TALENをコードする核酸は、異種プロモーターの制御下にある。いくつかの態様において、コードする核酸は、発現コンストラクト、例えば、プラスミド、ウイルスベクターまたは直鎖発現コンストラクトに含まれている。いくつかの態様において、核酸または発現コンストラクトは、細胞、組織、または生物中に存在する。

0098

本明細書に提供されるTALENをコードする例示的な核酸のマップを、図19に示す。かかる核酸の例示の配列を下に提供する。当業者は、本明細書に提供されるマップおよび配列は例示であり、本開示の範囲を限定するものではないことを理解するであろう。

0099

本明細書の別の箇所で説明したように、本開示により提供される改善されたTALENを含むTALENは、実質的に任意の核酸配列に結合する(および切断する)ように、使用される配列特異的TALE反復アレイに基づいて、操作することができる。いくつかの態様において、本明細書に提供される改善されたTALENは、疾患または障害と関連することが知られている遺伝子内の標的配列に結合する。いくつかの態様において、本明細書に提供されるTALENは、治療目的のために使用することができる。たとえば、いくつかの態様において、本明細書に提供されるTALENは、以下の1または2以上を含むがこれらに限定されない様々な疾患、障害、および/または状態のいずれかの処置のために使用され得る:自己免疫疾患(例えば、糖尿病狼瘡多発性硬化症乾癬関節リウマチ);炎症性疾患(例えば、関節炎骨盤内炎症性疾患);感染症(例えば、ウイルス感染(例えば、HIV、HCV、RSV)、細菌感染真菌感染敗血症);神経学的障害(例えば、アルツハイマー病ハンチントン病自閉症デュシェンヌ型筋ジストロフィー);心臓血管疾患(例えば、アテローム性動脈硬化症高コレステロール血症血栓症凝固障害黄斑変性症などの血管新生障害);増殖性疾患(例えばがん、良性腫瘍);呼吸器疾患(例えば、慢性閉塞性肺疾患);消化器疾患(例えば、炎症性腸疾患潰瘍);筋骨格障害(例えば、線維筋痛、関節炎);内分泌、代謝、および栄養障害(例えば、糖尿病、骨粗しょう症);泌尿器疾患(例えば、腎疾患);精神障害(例えば、うつ病統合失調症);皮膚疾患(例えば創傷湿疹);血液およびリンパ管障害(例えば、貧血血友病)など。いくつかの態様において、TALENは、二量体化の際に標的配列を切断する。いくつかの態様において、本明細書に提供されるTALENは、疾患または障害に関連するアレル内の標的部位を切断する。いくつかの態様において、TALENは標的部位を切断し、これが、疾患または障害の処置または予防をもたらす。いくつかの態様において、疾患は、HIV/AIDSである。いくつかの態様において、疾患は増殖性疾患である。いくつかの態様において、TALENは、CCR5標的配列(例えば、HIVに関連するCCR5配列)に結合する。いくつかの態様において、TALENは、ATM標的配列(例えば、毛細血管拡張性運動失調症に関連するATM標的配列)に結合する。いくつかの態様において、TALENは、VEGFA標的配列(例えば、増殖性疾患に関連するVEGFA配列)に結合する。いくつかの態様において、TALENは、CFTR標的配列(例えば、嚢胞性線維症に関連するCFTR配列)に結合する。いくつかの態様において、TALENは、ジストロフィン標的配列(例えば、デュシェンヌ型筋ジストロフィーに関連するジストロフィン遺伝子配列)に結合する。いくつかの態様において、TALENは、ヘモクロマトーシス、血友病、シャルコー・マリー・トゥース病、神経線維腫症フェニルケトン尿症多発性嚢胞腎疾患鎌状赤血球病、またはテイサックス病に関連する標的配列に結合する。好適な標的遺伝子、例えば、リストされている疾患の原因となる遺伝子は、当業者に知られている。疾患または障害に関連する追加の遺伝子および遺伝子配列は、当業者には明らかであろう。

0100

本開示のいくつかの側面では、以前に使用されたTALEエフェクタードメインと比較して、非特異的核酸結合活性が減少したN末端およびC末端TALEエフェクタードメインなどの、単離されたTALEエフェクタードメインを提供する。本明細書で提供される単離されたTALEエフェクタードメインは、好適なTALEエフェクター分子の場面において、例えばTALEヌクレアーゼ、TALE転写活性化因子、TALE転写リプレッサー、TALEリコンビナーゼ、およびTALEエピゲノム修飾酵素などで、使用することができる。その場面において単離されたTALEドメインが使用できる追加の好適なTALEエフェクターは、本開示に基づいて当業者には明らかであろう。一般に、本明細書で提供される単離されたN末端およびC末端ドメインは、生理的pHで正に荷電した(カチオン性)アミノ酸残基によって付与される過剰な結合エネルギーを最適化する、例えば最小化するように、操作される。本明細書で提供される改善されたN末端またはC末端TALEドメインのいくつかは、それぞれの標準TALEドメインと比較して、標的核酸配列に結合するための減少した正味電荷および/または減少した結合エネルギーを有している。TALEエフェクター分子の一部として使用する場合、例えば、TALEヌクレアーゼ、TALE転写活性化因子、TALE転写リプレッサー、TALEリコンビナーゼ、またはTALEエピゲノム修飾酵素の一部として使用する場合は、荷電におけるこの減少は、修飾N末端およびC末端ドメイン(単数または複数)を介した、オフターゲット結合の減少につながる。したがって、標的認識および結合の部分は、本明細書の他の箇所でより詳細に説明されるように、より狭く、TALE反復アレイの特異的認識および結合活性に限定される。得られたTALEエフェクター分子は、したがって、非修飾ドメインを使用するTALEエフェクター分子と比較して、結合の特異性の増加、ひいてはTALEエフェクターのそれぞれの効果の特異性の増加を示す(例えば、TALEヌクレアーゼによる標的部位の切断、TALE転写活性化因子による標的遺伝子の活性化、TALE転写リプレッサーによる標的遺伝子の発現の抑制、TALEリコンビナーゼによる標的配列の組換え、またはTALEエピゲノム修飾酵素による標的配列のエピジェネティックな修飾)。

0101

いくつかの態様において、正味電荷が標準N末端ドメイン(配列番号1)の正味電荷より小さい、単離されたN末端TALEドメインが提供される。いくつかの態様において、正味電荷が標準C末端ドメイン(配列番号22)の正味電荷より小さい、単離されたC末端TALEドメインが提供される。いくつかの態様において、標的核酸分子への結合エネルギーが、標準N末端ドメイン(配列番号1)の結合エネルギーより小さい、単離されたN末端TALEドメインが提供される。いくつかの態様において、標的核酸分子への結合エネルギーが、標準C末端ドメイン(配列番号22)の結合エネルギーより小さい、単離されたC末端TALEドメインが提供される。いくつかの態様において、本明細書で提供される単離されたN末端および/または単離されたC末端TALEドメインの結合エネルギーは、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、または少なくとも99%、低減されている。

0102

いくつかの態様において、標準N末端ドメインおよび/または標準C末端ドメインは、生理的pHで正に荷電したアミノ酸残基を、荷電していないかまたは負に荷電したアミノ酸残基で置き換えるよう修飾されて、本明細書で提供される単離されたN末端および/またはC末端ドメインが達成される。いくつかの態様において、修飾は、正に荷電した残基の、負に荷電した残基による置換を含む。いくつかの態様において、修飾は、正に荷電した残基の、中性(非荷電)残基による置換を含む。いくつかの態様において、修飾は、正に荷電した残基の、電荷を有さないかまたは負電荷を有する残基による置換を含む。いくつかの態様において、本明細書で提供される単離N末端ドメインおよび/または単離C末端ドメインの正味電荷は、生理的pHにおいて+10以下、+9以下、+8以下、+7以下、+6以下、+5以下、+4以下、+3以下、+2以下、+1以下、0以下、−1以下、−2以下、−3以下、−4以下、−5以下、または−10以下である。いくつかの態様において、単離N末端TALEドメインおよび/または単離C末端TALEドメインの正味電荷は、生理的pHにおいて+5〜−5の間、+2〜−7の間、0〜−5の間、0〜−10の間、−1〜−10の間、または−2〜−15の間である。いくつかの態様において、単離N末端ドメインおよび/または単離C末端ドメインの正味電荷は、負である。いくつかの態様において、単離N末端TALEドメインおよび/または単離C末端TALEドメインが提供され、単離N末端TALEドメインおよび単離C末端TALEドメインの正味電荷は、共に負である。いくつかの態様において、単離N末端TALEドメインおよび単離C末端TALEドメインの正味電荷は、中性またはわずかに正である(例えば、生理的pHで+2未満または+1未満)。いくつかの態様において、単離N末端TALEドメインおよび/または単離C末端TALEドメインが提供され、単離N末端TALEドメインおよび単離C末端TALEドメインの正味電荷は、共に、中性またはわずかに正である(例えば、生理的pHで+2未満または+1未満)。

0103

いくつかの態様において、本明細書に提供される単離N末端ドメインおよび/または単離C末端ドメインは、標準ドメイン配列の少なくとも1つのカチオン性アミノ酸残基が、生理的pHで電荷を示さないかまたは負電荷を示すアミノ酸残基で置き換えられている点で、それぞれの標準ドメイン配列とは異なっているアミノ酸配列を含む。いくつかの態様において、提供される単離N末端ドメインおよび/または単離C末端ドメインの少なくとも1個の、少なくとも2個の、少なくとも3個の、少なくとも4個の、少なくとも5個の、少なくとも6個の、少なくとも7個の、少なくとも8個の、少なくとも9個の、少なくとも10個の、少なくとも11個の、少なくとも12個の、少なくとも13個の、少なくとも14個の、または少なくとも15個のカチオン性アミノ酸は、生理的pHで電荷を示さないかまたは負電荷を示すアミノ酸残基で置き換えられている。いくつかの態様において、単離N末端ドメインおよび/または単離C末端ドメインの1、2、3、4、5、6、7、8、9、10、11、12、13、14、15個のカチオン性アミノ酸は、生理的pHで電荷を示さないかまたは負電荷を示すアミノ酸残基で置き換えられている。

0104

いくつかの態様において、カチオン性アミノ酸残基は、アルギニン(R)、リジン(K)、またはヒスチジン(H)である。いくつかの態様において、カチオン性アミノ酸残基は、RまたはHである。いくつかの態様において、生理的pHで電荷を示さないかまたは負電荷を示すアミノ酸残基は、グルタミン(Q)、グリシン(G)、アスパラギン(N)、スレオニン(T)、セリン(S)、アスパラギン酸(D)またはグルタミン酸(E)である。いくつかの態様において、生理的pHで電荷を示さないかまたは負電荷を示すアミノ酸残基は、Qである。いくつかの態様において、単離N末端ドメインおよび/または修飾C末端ドメインの少なくとも1つのリジンまたはアルギニン残基は、グルタミン残基で置き換えられている。

0105

いくつかの態様において、次のアミノ酸置換の1または2以上を含む単離C末端TALEドメインが、本明細書で提供される:K777Q、K778Q、K788Q、R789Q、R792Q、R793Q、R801Q。いくつかの態様において、単離C末端ドメインは、次のアミノ酸置換の2または3以上を含む:K777Q、K778Q、K788Q、R789Q、R792Q、R793Q、R801Q。いくつかの態様において、単離C末端ドメインは、次のアミノ酸置換の3または4以上を含む:K777Q、K778Q、K788Q、R789Q、R792Q、R793Q、R801Q。いくつかの態様において、単離C末端ドメインは、次のアミノ酸置換の4または5以上を含む:K777Q、K778Q、K788Q、R789Q、R792Q、R793Q、R801Q。いくつかの態様において、単離C末端ドメインは、次のアミノ酸置換の5または6以上を含む:K777Q、K778Q、K788Q、R789Q、R792Q、R793Q、R801Q。いくつかの態様において、単離C末端ドメインは、次のアミノ酸置換の6または7以上を含む:K777Q、K778Q、K788Q、R789Q、R792Q、R793Q、R801Q。いくつかの態様において、単離C末端ドメインは、次のアミノ酸置換の全7つを含む:K777Q、K778Q、K788Q、R789Q、R792Q、R793Q、R801Q。いくつかの態様において、単離C末端ドメインは、Q3バリアント配列(K788Q、R792Q、R801Q、配列番号23参照)を含む。いくつかの態様において、単離C末端ドメインは、Q7バリアント配列(K777Q、K778Q、K788Q、R789Q、R792Q、R793Q、R801Q、配列番号24参照)を含む。

0106

いくつかの態様において、標準N末端ドメインのトランケート型である、単離N末端TALEドメインが提供される。いくつかの態様において、標準C末端ドメインのトランケート型である、単離C末端TALEドメインが提供される。いくつかの態様において、トランケートされたN末端ドメインおよび/またはトランケートされたC末端ドメインは、標準ドメインの残基の90%未満、80%未満、70%未満、60%未満、50%未満、40%未満、30%未満、または25%未満を含む。いくつかの態様において、トランケートされたC末端ドメインは、60個未満、50個未満、40個未満、30個未満、29個未満、28個未満、27個未満、26個未満、25個未満、24個未満、23個未満、22個未満、21個未満、または20個のアミノ酸残基を含む。いくつかの態様において、トランケートされたC末端ドメインは、60、59、58、57、56、55、54、53、52、51、50、49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、または10個の残基を含む。いくつかの態様において、トランケートされ、1または2以上のアミノ酸置換を含む、単離N末端TALEドメインおよび/または単離C末端TALEドドメインが提供される。いくつかの態様において、単離N末端TALEドメインは、配列番号2〜5のいずれかに提供されるアミノ酸配列を含む。いくつかの態様において、単離C末端TALEドメインは、配列番号23〜25のいずれかに提供されるアミノ酸配列を含む。

0107

本明細書で提供される単離されたCおよびN末端TALEエドメインは、任意のTALEエフェクター分子の場面において、例えばTALEヌクレアーゼ、TALE転写活性化因子、TALE転写リプレッサー、TALEリコンビナーゼ、TALEエピゲノム修飾酵素、および任意のその他の好適なTALEエフェクター分子の一部として使用できることが、当業者には明らかであろう。いくつかの態様において、本明細書で提供されるTALEドメインは、次の構造を含むかまたは本質的にこれからなるTALE分子の場面において、使用される。
[N末端ドメイン]−[TALE反復アレイ]−[C末端ドメイン]−[エフェクタードメイン]
または
[エフェクタードメイン]−[N末端ドメイン]−[TALE反復アレイ]−[C末端ドメイン]
この式中、エフェクタードメインは、いくつかの態様において、ヌクレアーゼドメイン、転写活性化因子もしくはリプレッサードメイン、リコンビナーゼドメイン、またはエピゲノム修飾酵素ドメインであってよい。

0108

当業者には明らかなように、いくつかの態様においては、トランケートを収容するために、例えば本明細書で提供されるようなトランケートされたC末端ドメインなどのトランケートされたドメインを使用する場合に、スペーサーを含むTALEエフェクタードメインにおけるかかるDNAスペーサー長を調整することが好ましい。

0109

本開示のいくつかの側面は、例えば、TALEN単量体などのTALENを含む組成物を提供する。いくつかの態様において、組成物は、TALEN単量体と、該TALENとヘテロ二量体を形成することができる別のTALEN単量体とを含む。

0110

いくつかの態様において、TALENは、例えばヒト対象などの対象への投与用に処方された組成物中に提供される。例えば、いくつかの態様において、TALENおよび薬学的に許容し得る賦形剤を含む、医薬組成物が提供される。いくつかの態様において、医薬組成物は、対象への投与のために処方される。いくつかの態様において、医薬組成物は、対象における細胞内の標的配列を切断するためのTALENの有効量を含む。いくつかの態様において、TALENは、疾患または障害に関連することが知られている遺伝子内の標的配列に結合し、ここで組成物は、疾患または障害に関連する症状を軽減するためのTALENの有効量を含む。

0111

例えば、いくつかの態様は、本明細書で提供されるTALEN、またはかかるヌクレアーゼをコードする核酸、および薬学的に許容し得る賦形剤を含む、医薬組成物を提供する。医薬組成物は、任意に1または2以上の追加の治療的に活性な物質を含んでもよい。

0112

本明細書に記載の医薬組成物の製剤は、薬理学の分野で既知のまたは今後開発される任意の方法によって、製造することができる。一般にかかる製造方法は、活性成分を、賦形剤および/または1もしくは2以上の他の補助成分と会合させるステップ、次いで必要に応じて、および/または望ましい場合には、生成物を所望の単一または複数用量単位成形および/または包装すること、を含む。

0113

医薬製剤は、薬学的に許容し得る賦形剤をさらに含んでもよく、これは本明細書中で使用する場合、所望の特定の剤形に適するように、任意の全ての溶媒分散媒質希釈剤、または他の液体ビヒクル、分散もしくは懸濁助剤表面活性剤等張剤、増粘剤または乳化剤防腐剤固体結合剤潤滑剤等を含む。RemingtonのThe Science and Practice of Pharmacy, 21st Edition, A. R. Gennaro(Lippincott, Williams & Wilkins, Baltimore, MD, 2006;参照により本明細書に組み込まれる)には、医薬組成物の処方に使用される種々の賦形剤および、その製造のための知られている技術が開示されている。任意の従来の賦形剤媒体が、例えば任意の望ましくない生物学的効果を生成するか、あるいは医薬組成物の任意の他の成分(単数または複数)と有害な様式で相互作用することによって物質またはその誘導体と不適合である限りを除き、その使用は、本発明の範囲内にあることが意図されている。

0114

いくつかの態様において、本明細書で提供される組成物は、例えばヒト対象などの対象に対して、対象内の標的ゲノム修飾を行うために投与される。いくつかの態様において、細胞を対象から得て、ex vivoでヌクレアーゼまたはヌクレアーゼをコードする核酸と接触させ、所望のゲノム修飾が細胞内で行われるかまたは検出された後に、その対象に再投与される。本明細書で提供される医薬組成物の記述は、主にヒトへの投与に好適な医薬組成物に向けられているが、当業者は、かかる組成物が一般にあらゆる種類の動物への投与に好適であることを、理解するであろう。ヒトへの投与に好適な医薬組成物の、組成物を様々な動物への投与に好適なものとするための修飾は充分に理解されており、通常の知識を有する獣医学薬理学者は、日常的な実験以上を用いることなく、かかる修飾を設計および/または実施することができる。医薬組成物の投与が意図される対象としては、限定はされないが、ヒトおよび/または他の霊長類;限定することなくウシ、ブタウマ、ヒツジ、ネコ、イヌ、マウスおよび/またはラットを含む哺乳動物;および/またはニワトリ、アヒルガチョウ、および/またはシチメンチョウなどの商業的に関連する鳥類を含む、などが挙げられる。

0115

本開示の範囲は、本明細書に提供されるTALENを使用する方法を包含する。当業者には、本明細書に提供されるTALENは、TALENの適用に好適な任意の方法において使用されることが明らかであり、これは当該技術分野で知られている方法および用途を含むが、これに限定はされない。かかる方法は、例えばゲノム操作の場面におけるTALEN媒介性のDNAの切断を含み、例えば、外来DNA鋳型を使用する非相同末端結合(NHEJ)を介した標的遺伝子ノックアウト、または相同性配向型修復(HDR)を介した標的ゲノム配列置換である。本明細書で提供されるTALENの改善された特徴、例えば、本明細書に提供されるTALENのいくつかの改善された特異性は、典型的には、かかる方法および用途を高い効率で実施することを可能とする。TALENの使用に好適であり、本明細書で提供されるTALENを用いて実施されるすべての方法および用途が意図され、本開示の範囲内である。例えば、本開示は、本明細書に提供されるTALENの、以下の文献に記載されているようなTALENの使用に好適な任意の方法における使用を提供する:Boch, Jens (February 2011). “TALEs of genome targeting”. Nature Biotechnology 29 (2): 135-6. doi:10.1038/nbt.1767.PMID 21301438;Boch, Jens; et.al. (December 2009). “Breaking the Code of DNA Binding Specificity of TAL-Type III Effectors”. Science 326 (5959): 1509-12. Bibcode:2009Sci...326.1509B. doi:10.1126/science.1178811. PMID 19933107;Moscou, Matthew J.; Adam J. Bogdanove (December 2009). “A SimpleCipher Governs DNA Recognition by TAL Effectors”. Science 326 (5959): 1501. Bibcode:2009Sci...326.1501M. doi:10.1126/science.1178817. PMID 19933106;Christian, Michelle; et.al. (October 2010). “Targeting DNA Double-Strand Breaks with TAL Effector Nucleases”. Genetics 186 (2): 757-61. doi:10.1534/genetics.110.120717. PMC 2942870. PMID 20660643;Li, Ting; et.al. (August 2010). “TAL nucleases (TALNs): hybrid proteins composed of TAL effectors and FokI DNA-cleavage domain”. Nucleic AcidsResearch 39: 1-14. doi:10.1093/nar/gkq704. PMC 3017587. PMID 20699274;Mahfouz, Magdy M.; et.al. (February 2010). “De novo-engineered transcription activator-like effector (TALE) hybrid nuclease with novel DNA binding specificity creates double-strand breaks”. PNAS 108 (6): 2623-8. Bibcode:2011PNAS..108.2623M. doi:10.1073/pnas.1019533108. PMC 3038751. PMID 21262818;Cermak, T.; Doyle, E. L.; Christian, M.; Wang, L.; Zhang, Y.; Schmidt, C.; Baller, J. A.; Somia, N. V. et al. (2011). “Efficient design and assembly of custom TALEN andotherTAL effector-based constructs for DNA targeting”. Nucleic Acids Research. doi:10.1093/nar/gkr218;Miller, Jeffrey; et.al. (February 2011). “A TALE nuclease architecture for efficient genome editing”. Nature Biotechnology 29 (2): 143-8. doi:10.1038/nbt.1755. PMID 21179091;Hockemeyer, D.; Wang, H.; Kiani, S.; Lai, C. S.; Gao, Q.; Cassady, J. P.; Cost, G. J.; Zhang, L. et al. (2011). “Genetic engineering of human pluripotent cells using TALE nucleases”. Nature Biotechnology 29 (8). doi:10.1038/nbt.1927;Wood, A. J.; Lo, T. -W.; Zeitler, B.; Pickle, C. S.; Ralston, E. J.; Lee, A. H.; Amora, R.; Miller, J. C. et al. (2011). “Targeted Genome Editing Across Species Using ZFNs and TALENs”. Science 333 (6040): 307. doi:10.1126/science.1207773. PMC 3489282. PMID 21700836;Tesson, L.; Usal, C.; Menoret, S. V.; Leung, E.; Niles, B. J.; Remy, S. V.; Santiago, Y.; Vincent, A. I. et al. (2011). “Knockout rats generated by embryo microinjection of TALENs”. Nature Biotechnology 29 (8): 695. doi:10.1038/nbt.1940;Huang, P.; Xiao, A.; Zhou, M.; Zhu, Z.; Lin, S.; Zhang, B. (2011). “Heritable gene targeting in zebrafish using customized TALENs”. Nature Biotechnology 29 (8): 699. doi:10.1038/nbt.1939;Doyon, Y.; Vo, T. D.; Mendel, M. C.; Greenberg, S. G.; Wang, J.; Xia, D. F.; Miller, J. C.; Urnov, F. D. et al. (2010). “Enhancing zinc-finger-nuclease activity with improved obligate heterodimeric architectures". Nature Methods 8 (1): 74-79. doi:10.1038/nmeth.1539. PMID 21131970;Szczepek, M.; Brondani, V.; Buchel, J.; Serrano, L.; Segal, D. J.; Cathomen, T. (2007). “Structure-based redesign of the dimerization interface reduces the toxicity of zinc-finger nucleases”. Nature Biotechnology 25 (7): 786. doi:10.1038/nbt1317. PMID 17603476;Guo, J.; Gaj, T.; Barbas Iii, C. F. (2010). “Directed Evolution of an Enhanced and Highly Efficient FokI Cleavage Domain for Zinc Finger Nucleases”. Journal of Molecular Biology 400 (1): 96. doi:10.1016/j.jmb.2010.04.060. PMC 2885538. PMID 20447404;Mussolino, C.; Morbitzer, R.; Lutge, F.; Dannemann, N.; Lahaye, T.; Cathomen, T. (2011). “A novel TALE nuclease scaffold enables high genome editing activity in combination with low toxicity”. Nucleic Acids Research. doi:10.1093/nar/gkr597;Zhang, Feng; et.al. (February 2011). “Efficient construction of sequence-specific TAL effectors for modulating mammalian transcription”. Nature Biotechnology 29 (2): 149-53. doi:10.1038/nbt.1775. PMC 3084533. PMID 21248753;Morbitzer, R.; Elsaesser, J.; Hausner, J.; Lahaye, T. (2011). “Assembly of custom TALE-type DNA binding domains by modular cloning”. Nucleic Acids Research. doi:10.1093/nar/gkr151;Li, T.; Huang, S.; Zhao, X.; Wright, D. A.; Carpenter, S.; Spalding, M. H.; Weeks, D. P.; Yang, B. (2011). “Modularly assembled designer TAL effector nucleases for targeted gene knockout and gene replacement in eukaryotes”. Nucleic Acids Research. doi:10.1093/nar/gkr188;Geiβler, R.; Scholze, H.; Hahn, S.; Streubel, J.; Bonas, U.; Behrens, S. E.; Boch, J. (2011). “Transcriptional Activators of Human Genes with Programmable DNA-Specificity”. In Shiu, Shin-Han.PLoS ONE 6 (5): e19509. doi:10.1371/journal.pone.0019509;Weber, E.; Gruetzner, R.; Werner, S.; Engler, C.; Marillonnet, S. (2011). “Assembly of Designer TAL Effectors by Golden Gate Cloning”. In Bendahmane, Mohammed. PLoS ONE 6 (5): e19722. doi:10.1371/journal.pone.0019722;Sander et al. “Targeted gene disruption in somatic zebrafish cells using engineered TALENs”. Nature Biotechnology Vol 29:697-98 (5 August 2011) Sander, J. D.; Cade, L.; Khayter, C.; Reyon, D.; Peterson, R. T.; Joung, J. K.; Yeh, J. R. J. (2011). “Targeted gene disruption in somatic zebrafish cells using engineered TALENs”. Nature Biotechnology 29 (8): 697. doi:10.1038/nbt.1934;これらの全内容は、参照により本明細書に組み込まれる。

0116

いくつかの態様において、本明細書に記載のTALEN、TALENドメイン、TALENをコードするもしくはTALENドメインをコードする核酸、組成物および試薬は、単離されている。いくつかの態様において、本明細書に記載のTALEN、TALENドメイン、TALENをコードするもしくはTALENドメインをコードする核酸、組成物および試薬は、精製されており、例えば、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、または少なくとも95%純粋である。

0117

本開示のいくつかの側面は、本明細書に記載の本発明のTALENを用いて、核酸分子中の標的配列を切断する方法を提供する。いくつかの態様において、方法は、標的配列を含む核酸分子を、TALENが標的配列に結合して切断するために好適な条件下で、標的配列に結合するTALENと接触させることを含む。いくつかの態様において、TALENは、単量体として提供される。いくつかの態様において、本発明のTALEN単量体は、本発明の第1のTALEN単量体と二量体化してヌクレアーゼ活性を有するヘテロ二量体を形成することができる別のTALEN単量体を含む、組成物中に提供される。いくつかの態様において、本発明のTALENは、医薬組成物中に提供される。いくつかの態様において、標的配列は、細胞内にある。いくつかの態様において、標的配列は、細胞のゲノム内にある。いくつかの態様において、標的配列は、対象中にある。いくつかの態様において、この方法は、TALENを含有する例えば医薬組成物などの組成物を、対象に対して、TALENが標的部位に結合してトランケートするのに充分な量で投与することを含む。

0118

本開示のいくつかの側面は、操作されたTALENを製造する方法を提供する。いくつかの態様において、方法は、標準N末端TALENドメインおよび/または標準C末端TALENドメインの少なくとも1個のアミノ酸を、生理的pHで電荷を有さないかまたは負電荷を有するアミノ酸で置き換えること;および/または、N末端TALENドメインおよび/またはC末端TALENドメインをトランケートして、正に荷電した断片を除去すること;したがって、減少した正味電荷のN末端ドメインおよび/またはC末端ドメインを有する、操作されたTALENを生成すること、を含む。いくつかの態様において、置換される少なくとも1つのアミノ酸は、カチオン性アミノ酸または生理的pHで正電荷を有するアミノ酸を含む。いくつかの態様において、少なくとも1つのアミノ酸を置き換えるアミノ酸は、カチオン性アミノ酸または中性のアミノ酸である。いくつかの態様において、トランケートされたN末端TALENドメインおよび/またはトランケートされたC末端TALENドメインは、それぞれの標準ドメインの残基の90%未満、80%未満、70%未満、60%未満、50%未満、40%未満、30%未満、または25%未満を含む。いくつかの態様において、トランケートされたC末端ドメインは、60個未満、50個未満、40個未満、30個未満、29個未満、28個未満、27個未満、26個未満、25個未満、24個未満、23個未満、22個未満、21個未満、または20個未満のアミノ酸残基を含む。

0119

いくつかの態様において、トランケートされたC末端ドメインは、60、59、58、57、56、55、54、53、52、51、50、49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、または10個のアミノ酸残基を含む。いくつかの態様において、方法は、標準N末端TALENドメインおよび/または標準C末端TALENドメインの少なくとも2個、少なくとも3個、少なくとも4個、少なくとも5個、少なくとも6個、少なくとも7個、少なくとも8個、少なくとも9個、少なくとも10個、少なくとも11個、少なくとも12個、少なくとも13個、少なくとも14個、または少なくとも15個のアミノ酸を、生理的pHで電荷を有さないかまたは負電荷を有するアミノ酸で置き換えることを含む。いくつかの態様において、置き換えられるアミノ酸は、アルギニン(R)またはリジン(K)である。いくつかの態様において、生理的pHで電荷を有さないかまたは負電荷を有するアミノ酸は、グルタミン(Q)またはグリシン(G)である。いくつかの態様において、方法は、少なくとも1つのリジンまたはアルギニン残基を、グルタミン残基で置き換えることを含む。

0120

いくつかの態様において、本明細書で提供される改善されたTALENは、組換え技術によって設計され、および/または生成される。いくつかの態様において、設計すること、および/または生成することは、所望の標的配列またはそれらの半部位に特異的に結合する、TALE反復アレイを設計することを含む。

0121

本開示のいくつかの側面は、本明細書に提供される操作されたTALENまたはかかるTALENを含む組成物(例えば、医薬組成物)を含む、キットを提供する。いくつかの態様において、キットは、TALENを賦形剤と接触させて、核酸をTALENと接触させるのに好適な組成物を生成するための、賦形剤および指示書を含む。いくつかの態様において、賦形剤は、薬学的に許容し得る賦形剤である。

0122

典型的には、キットは、キットの構成要素を格納する容器、および、キットの構成要素を如何にして貯蔵し使用すべきかを述べた書面による指示書を含む。

0123

本発明のこれらおよび他の態様の機能および利点は、以下の例からより完全に理解されるであろう。以下の例は、本発明の利点を説明し、および特定の態様を記述することを意図しているが、本発明の完全な範囲を例示することは意図していない。したがって、例は本発明の範囲を限定するものではないことが理解されるであろう。

0124

例1
材料および方法
オリゴヌクレオチド、PCRおよびDNA精製
すべてのオリゴヌクレオチドは、Integrated DNA Technologies(IDT)から購入した。オリゴヌクレオチド配列は、表10に記載されている。PCRは、50μLの1×HF緩衝液中の0.4μLの2U/μL Phusion Hot Start IIDNAポリメラーゼ(Thermo-Fisher)、0.2mMのdNTミックス(0.2mMのdATP、0.2mMのdCTP、0.2mMのdGTP、0.2mMのdTTP)(NEB)、0.5μM〜1μMの各プライマーを用い、次のプログラムで実施した:特に断りのない限り、98℃、1分;[98℃、15秒;62℃、15秒;72℃、1分]を35サイクル。DNA反応物の多くは、以下ではQカラム精製と呼ばれるQIAquick PCR Purification Kit(Qiagen)、または以下ではMカラム精製と呼ばれるMinElute PCR Purification Kit(Qiagen)を用いて精製した。

0125

TALENの構築
標準TALENプラスミドは、FLASH法12により、各TALENが10〜18塩基対を標的として構築した。N末端変異は、PCRによりQ5 Hot Start Master Mix(NEB)[98℃、22秒;62℃、15秒;72℃、7分]を用いて、リン酸化TAL-N1fwd(N1に対し)、リン酸化TAL-N2fwd(N2に対し)、またはリン酸化TAL-N3fwd(N3に対し)、およびリン酸化TALNrevをプライマーとして使用して行った。1μLのDpnI(NEB)を添加し、反応物を37℃で30分間インキュベートし、次いでMカラム精製した。溶出した〜25ngのDNAを、10μLの2×Quick Ligase Buffer、1μLのQuick Ligase(NEB)中、20μLの総容量で、室温(〜21℃)で15分、分子内で平滑末端ライゲーションした。このライゲーション反応物1μLを、トップ10のケミカルコンピテント細胞(Invitrogen)に形質転換した。C末端ドメインの変異は、PCRによりTAL-CifwdとTAL-Cirevプライマーを用いてクローニングした後、Qカラム精製した。この溶出DNA〜1ngを鋳型として、TALCifwdおよびTAL-Q3(Q3に対し)またはTAL-Q7(Q7に対し)の何れかをプライマーとするPCRに使用し、次いでQカラム精製した。このDNA断片〜1μgを、1×NEBuffer 4中のHpaIおよびBamHIで消化し、HpaIおよびBamHIで前もって消化された約2μgの所望のTALENプラスミド中にクローンニングした。

0126

in vitroでのTALENの発現
全てが3×FLAGタグを含むTALENタンパク質を、in vitro転写/翻訳により発現させた。TALENをコードするプラスミドまたはプラスミドなし(「空の溶解物」対照)800ngを、TNT登録商標)Quick Coupled Transcription/Translation System、T7バリアント(Promega)を最終容量20μLで30℃にて1.5時間用いて、in vitro転写/翻訳反応物中に添加した。ウェスタンブロットを使用し、抗FLAG M2モノクローナル抗体(Sigma-Aldrich)を用いてタンパク質を可視化した。TALEN濃度は、1ng〜16ngのN末端FLAGタグ付き細菌アルカリホスファターゼ(Sigma-Aldrich)の標準曲線と比較することにより、算出した。

0127

DNA切断のためのin vitro選択
選択前ライブラリーを、部分的にランダム化された標的半部位配列(CCR5A、ATM、またはCCR5B)および完全にランダム化された10〜24bpスペーサー配列を含有する、10pmolのオリゴライブラリーを用いて製造した(表10)。オリゴヌクレオチドライブラリーを、2.5mMのMnCl2を補足した1×CircLigase II反応緩衝液(33mMのトリ酢酸、66mMの酢酸カリウム、0.5mMのジチオスレイトール、pH7.5)の全20μL中の、100単位のCircLigase II ssDNA Ligase(Epicentre)で60℃にて16時間インキュベートすることにより、個別に環状化し、ついで80℃で10分インキュベートした。2.5μLの各環状化反応物を、Illustra TempliPhi 100 Amplification Kit(GE Healthcare)を使用するローリングサークル増幅のための基質として、30℃で16時間、50μLの反応物中で用いた。得られたコンカテマーライブラリーを、Quant-iT(商標)PicoGreen(登録商標)dsDNA Kit(Invitrogen)で定量し、異なるスペーサー長のライブラリーを、等モル比で混合した。

0128

CCR5B配列ライブラリーでの選択については、500ngの選択前ライブラリーを、1×NEBuffer 3中、in vitro転写/翻訳TALEN+空の溶解物(合計30μL)で37℃にて2時間消化した。すべてのCCR5B TALENについて、in vitro転写/翻訳TALEN濃度をウェスタンブロットにより定量し(ブロット中、TALENを4℃で16時間保存)、次いでTALENを、単量体当たり40nMの最終濃度で添加した。CCR5AおよびATM配列ライブラリーでの選択については、合わせた選択前ライブラリーを、300,000MWCOスピンカラム(Sartorius)を用い、1×NEBuffer 3での3回の500μL洗浄により、さらに精製した。125ngの選択前ライブラリーを、1×NEBuffer 3中、合計24μLの新鮮なin vitro転写/翻訳TALEN+空の溶解物で37℃で30分消化した。すべてのCCR5AおよびATM TALENについて、6μLのin vitro転写/翻訳左TALENおよび6μLの右TALENを使用し、これらはそれぞれ、CCR5AおよびATM TALENについて、切断反応物の最終濃度16nM±2nMまたは12nM±1.5nMに対応する。これらのTALEN濃度は、消化と並行して行ったウェスタンブロットにより定量した。

0129

すべての選択について、TALEN消化ライブラリーを、1μLの100μg/μLのRNaseA(Qiagen)で2分間インキュベートした後、Qカラム精製した。50μLの精製DNAを、3μLの10mM dNTPミックス(10mMのdATP、10mMのdCTP、10mMのdGTP、10mMのdTTP)(NEB)、6μLの10×NEBuffer 2、および1μLの5U/μL Klenow Fragment DNA Polymerase(NEB)で、室温で30分インキュベートした後、Qカラム精製した。50μLの溶出DNAを、各試料に対応するバーコードを含む加熱および冷却#1アダプターでライゲートした(異なるTALEN濃度またはコンストラクトによる選択)(表10A)。ライゲーションは、1×T4DNAリガーゼ緩衝液(50mMのTris-HCl、10mMのMgCl2、1mMのATP、10mMのDTT、pH7.5)中で1μLの400U/μL T4 DNAリガーゼ(NEB)により60μLの総容量で、室温にて16時間実施し、次いでQカラム精製した。

0130

6μLの溶出DNAのPCRによる増幅を、150μLの総反応容量(3×50μLの反応物に分割)で、表10Aの#2Aのアダプタープライマーを用いて14〜22サイクル実施した。PCR産物を、Qカラムで精製した。各DNA試料は、Quant-iT(商標)PicoGreen(登録商標)dsDNA Kit(Invitrogen)で定量化した後、等モル混合物プールした。500ngのプールされたDNAについて、5%TBEの18ウェルCriterion PAGEゲル(BioRad)を200Vで30分実行し、〜230塩基対の長さのDNA(1.5標的部位反復+アダプター配列に対応する)を単離し、Qカラム精製した。溶出DNA〜2ngをPCRで5〜8サイクル、#2Bアダプタープライマー(表10A)で増幅し、Mカラム精製した。

0131

10μLの溶出DNAを、12μLのAMPure XPビーズ(Agencourt)を用いて精製し、Illumina/Universal Library Quantification Kit(Kapa Biosystems)を用いて定量した。DNAは、Illuminaの指示に従ってハイスループットDNAシーケンシングのために製造し、MiSeq DNA Sequencer(Illumina)を用い、12pMの最終溶液および156bpのペアエンドリードを使用してシーケンシングした。シーケンシングのための選択前ライブラリーを製造するために、選択前ライブラリーを、1μL〜4μLの適切な制限酵素で(CCR5A=Tsp45I、ATM=Acc65I、CCR5B=AvaI(NEB))37℃で1時間消化した後、上記と同様2pmolの加熱および冷却#1ライブラリーアダプター(表10A)でライゲートした。選択前ライブラリーDNAを上記と同様に、#2Aライブラリーアダプタープライマーおよび#2Bライブラリーアダプタープライマーを、それぞれ#2Aアダプタープライマーおよび#2Bアダプタープライマー(表10A)の代わりに使用して製造した。得られた選択前ライブラリーDNAを、TALEN消化試料と共にシーケンシングした。

0132

個別のin vitroTALEN切断アッセイ
TALEN消化のための個別のDNA基質の構築を、表9Bに特定されたオリゴヌクレオチドのペアを制限クローニング14でpUC19(NEB)中に組み合わせることにより、実施した。対応するクローニングされたプラスミドの増幅を、PCRにより(59℃で15秒アニーリング)24サイクル、pUC19OfwdおよびpUC19Orevプライマー(表10B)を用いて実施し、Qカラム精製した。50ngの増幅したDNAを、1×NEBuffer 3中、それぞれ3μLのin vitro転写/翻訳TALEN左および右単量体(〜16nMから〜12nMの最終TALEN濃度に相当)および6μLの空の溶解物で、総反応容量120μLで消化した。消化反応物を37℃で30分間インキュベートし、次いで1μLの100μg/μLRNaseA(Qiagen)で2分間インキュベートし、Mカラム精製した。全体で10μLの溶出DNAに、グリセロールを15%まで添加したものを、5%TBE 18ウェルCriterion PAGEゲル上で(Bio-Rad)、200Vで45分間分析し、次に1×SYBR Gold(Invitrogen)で10分間染色した。バンドを、AlphaImager HP(Alpha Innotech)で可視化し、定量した。

0133

細胞のTALEN切断アッセイ
TALENを、哺乳動物発現ベクター12にクローニングし、得られたTALENベクターを前に記載のようにしてU2OS-EGFP細胞トランスフェクトした12。ゲノムDNAを、前に記載のようにして2日後に単離した12。各アッセイについて、50ngの単離したゲノムDNAの増幅を、PCRにより[98℃で15秒;67.5℃で15秒;72℃で22秒]、表10Cに指定のように4%DMSOありまたはなしのプライマー対を用いて35サイクル実施した。各ゲノム部位のPCR反応物の相対的DNA含量は、Quant-iT(商標)PicoGreen(登録商標)dsDNA Kit(Invitrogen)で定量し、次いで等モル混合物中にプールし、TALENなしの試料と全てのTALEN処置試料とを分離した。150〜350bpに相当するDNAを、上述のようにPAGEによって精製した。

0134

44μLの溶出DNAを、5μLの1×T4DNAリガーゼ緩衝液および1μLの10U/μLポリヌクレオチドキナーゼ(NEB)で、37℃で30分インキュベートし、Cカラム精製した。43μLの溶出DNAを、1μLの10mMのdATP(NEB)、5μLの10×NEBuffer 2、および1μLの5U/μLのDNAクレノウ断片(3’→5’エキソ−)(NEB)で、37℃で30分インキュベートし、Mカラム精製した。10μLの溶出DNAを、上記と同様に10pmolの加熱および冷却G(ゲノム)アダプター(表10A)でライゲートした。8μLの溶出DNAを、PCRにより、各試料に対応するバーコードを含むG−Bプライマーで6〜8サイクル増幅した。各試料のDNAを、Quant-iT(商標)PicoGreen(登録商標)dsDNA Kit(Invitrogen)で定量し、次いで等モル混合物中にプールした。合わせたDNAを、上記のようにMiSeqを用いてハイスループットシーケンシングに供した。

0135

データ分析
Illuminaシーケンシングリードをフィルタリングし、アルゴリズムセクション概説されるようにUnix Bashで記述されたスクリプト解析した。ソースコードは、リクエストにより入手可能である。特異性スコアは、前に記載のようにして算出した14。表3の様々なTALEN選択中の変異数の分布に関する統計解析は、前に記載のようにして実施した14。表7の修飾部位の統計解析は、前に記載のようにして実施した14。

0136

アルゴリズム
すべてのスクリプトはbashまたはMATLABで記述された。

0137

選択前配列および選択された配列のコンピューターによるフィルタリング
選択前配列について
1)最初の4塩基(ランダムな塩基)のリードの直後の、16bpの定常配列(CCR5A=CGTCACGCTCACCACT、CCR5B=CCTCGGGACTCCACGCT、ATM=GGTACCCCACTCCGCGT)を探索し、1つの変異を可能にする16bp定常配列を有する配列のみを承認する。
2)定常配列から、少なくとも最小可能限度の完全部位長から最大の完全部位長までの距離で離れている位置における、9bpの最終配列を探索して、完全部位の存在を確認し、この9bpの最終配列を有する配列のみを承認する。(最終配列:CCR5A=CGTCACGCT、CCR5B=CCTCGGGAC、ATM=GGTACGTGC)。
3)完全部位内の各半部位の最良の例を探索し、左の後に右という、正しい左および右半部位の順序のすべての配列を承認する。
4)2つの半部位と、左半部位の左の単一隣接ヌクレオチドおよび右半部位の右の単一隣接ヌクレオチドの間の、DNAスペーサー配列(半部位と定常配列の間の配列)を決定する。
5)シーケンシングリード品質スコアによりフィルタリングして、半部位の位置の4分の3に渡って品質スコアA以上の配列のみを承認する。

0138

選択された配列について
1)異なる選択条件に対応する正しい5bpのバーコードから開始される全ての配列の、全配列のリードおよび位置の品質スコアを、別々のファイルに出力する。
2)初期配列から少なくとも最小可能限度の完全部位長離れ、かつ初期配列から最大の完全部位長離れている位置で反復される、5bpのバーコードの直後の初期16bp配列を探索して、反復配列を有する完全部位の存在を確認し、1つの変異を可能にする16bpの反復を有する配列のみを承認する。
3)完全部位内の16bpの定常配列を探索し、1つの変異を可能にする定常配列を有する配列のみを承認する。配列の解析を、定常配列+5’配列から開始して2番目の反復配列まで、次にバーコードの後の初期配列から定常配列まで実施して、1つの完全部位の均等物を挟む複数定常配列を得る。
CONSTANT−LFLANK−LHS−SPACER−RHS−RFLANK−CONSTANT
LFLANK=左隣接配列(単一のランダム塩基として設計)
LHS=左半分部位配列
RHS=右半分部位配列
RFLANK=右隣接配列(単一のランダム塩基として設計)
CONSTANT=定常配列(CCR5A=CGTCACGCTCACCACT、CCR5B=CCTCGGGACTCCACGCT、ATM=GGTACCCCACTCCGCGT)
4)完全部位内の各半部位の最良の例を探索し、左の後に右という、正しい左および右半部位の順序のすべての配列を承認する。
5)半部位の位置で、対応するスペーサー(2つの半部位間の配列)、左隣接および右隣接配列(半部位と定常配列の間の配列)を決定する。
6)5bpのバーコード配列の後のリードの開始から、定常配列の始まりまでの配列を得ることにより、配列末端を決定する。
SEQUENCESTART−RHS−RFLANK−CONSTANT
7)シーケンシングリード品質スコアによりフィルタリングして、半部位の位置の4分の3に渡って品質スコアA以上の配列のみを承認する。
8)選択された配列を、スペーサー側からの各半部位中に0〜5個の塩基対の末端を有する配列の数の平均として計算された配列末端の背景の量よりも2.5倍豊富なスペーサー中に配列末端を有する配列のみを承認することによって(配列末端の背景数は、比較のための配列末端の背景として利用した配列末端に最も近い半部位を有する両方の半部位について計算した)、配列末端によってフィルタリングした。

0139

CCR5B標的部位に関連するゲノムオフターゲット部位のコンピューター探索
1)Patmatchプログラム39を使用して、パターン配列について次のようにヒトゲノム(GRCh37/hg19ビルド)を探索した:CCR5B左半部位配列(L16、L13またはL10)NNNNNNNNN ... CCR5B右部位配列(R16、R13またはR10)[M,0,0]、ここでNの数は12〜25で変化し、およびM(可能な変異を示す)は0〜14で変化する。
2)プログラムがX個以下の変異を有するすべての配列を出力するため、出力されるオフターゲット部位の数は脱累積されて、標的部位から離れた変異の特定数である、ヒトゲノム中のオフターゲット部位の数がもたらされるからである。

0140

ゲノム部位の配列におけるインデルの同定
1)各配列について、プライマー配列を使用してゲノム部位を同定した。
2)標的部位の左の8bpに対応する参照ゲノム配列、および完全標的部位の右の8bp(またはシーケンシングリードの最末端のゲノム部位については6bp)の参照ゲノム配列を含む配列は、標的部位配列と考えられた。
3)参照ゲノム部位と同じ大きさに対応する任意の標的部位配列は、非修飾と考えられ、参照サイズではない任意の配列は、ClustalW40で参照ゲノム部位と整列させた。
4)2つ半部位配列の間のDNAスペーサー配列における2つより多くの挿入または2つより多くの欠失を有する整列された配列は、インデルと考えられた。

0141

結果
CCR5およびATMを標的とするTALENの特異性プロファイリング
我々は、種々の長さの左および右半部位を標的とするTALEN、および異なるドメインバリアントを有するTALENを含む、合計41のヘテロ二量体TALEN対(以下TALENと呼ぶ)の特異性をプロファイリングした。41のTALENのそれぞれは、2つの異なるヒト遺伝子CCR5およびATMにおける、3つの異なる配列(CCR5A、CCR5B、またはATMと呼ぶ)の1つを標的とするように設計した(図7)。我々は、前述のin vitro選択法14の改良版に、選択のスループットおよび感度を高める変更を加えて使用した(図1B)。

0142

簡単に述べると、>1012のDNA配列の選択前ライブラリーにおいて、それぞれを、3nM〜40nMのin vitroで翻訳されたTALENで消化した。これらの濃度は、ヒト細胞核当たり〜20から〜200の二量体TALEN分子に相当し21、これは比較的低レベルの細胞タンパク質発現である22,23。切断されたライブラリーメンバーは、アダプターライゲーションによって捕捉してゲル精製により単離した、遊離の5’一リン酸を含んでいた(図1B)。対照試料において、選択前ライブラリーのすべてのメンバーは、定常配列において制限エンドヌクレアーゼにより切断されており、これらがアダプターライゲーションによって捕捉されゲル精製によって単離されることが可能であった。この選択プロセスを耐えたTALEN処置試料または対照試料のハイスループットシーケンシングとコンピューター解析により、TALENで切断されたすべての配列の存在量だけでなく、選択前の対応する配列の存在量が明らかにされた。選択を耐えた各ライブラリーメンバーの濃縮値の算出は、その選択後配列存在量を、その選択前存在量で割り算することにより行った。選択前DNAライブラリーは、その各々が、理論的には、オンターゲット配列に対して6個以下の変異を有する全ての可能なDNA配列の少なくとも10のコピーを含有するだけ、充分に大きかった。

0143

試験した全41のTALENについて、選択を耐えたDNAは、選択前ライブラリーに存在したよりも有意に少ない平均変異を標的半部位に含んでいた(表3および4)。例えば、18bpの左および右半部位を標的とするTALENで処置後の選択を耐えたDNA配列における変異の平均数は、CCR5A配列について4.06、ATM配列について3.18であり、比較して、対応する選択前ライブラリーではそれぞれ7.54と6.82の変異であった(図2Aおよび2B)。すべての選択について、オンターゲット配列は8〜640倍に濃縮された(表5)。我々の選択結果をin vitroで検証するために、13bpの左および右半部位(L13+R13)を標的とするCCR5B TALENの、16の多様なオフターゲット基質のそれぞれを切断する能力をアッセイした(図2Eおよび2F)。得られた個別のin vitro切断効率は、観測された濃縮値と良好に相関した(図2G)。

0144

全4つの可能な塩基対に対する、TALEN標的部位における各位置での特異性を決定するために、特異性スコアを選択前と選択後の塩基対頻度の差として算出し、これを、完全な特異性(1.0と定義)から完全な反特異性(anti-specificity)(−1.0と定義)までの選択前頻度の最大可能な変化について、正規化した。試験したすべてのTALENについて、両方の半部位内の全ての位置で標的とされた塩基対が好ましく、ただし唯一例外は、右半部位でのいくつかのATMTALENについてのスペーサーに最も近い塩基対であった(図2C、2Dおよび図8〜13)。N末端ドメインによって認識される5’Tヌクレオチドが高度に特異的であり、5’DNA末端(N末端TALEN末端)は、一般に、3’DNA末端よりも高い特異性を示す;両方の観測は、以前の報告と整合する24,25。まとめると、これらの結果は、選択データが正確にin vitroでのオフターゲットTALEN切断の効率を予測し、TALENが、標的配列全体にわたって高度に特異的であることを示す。

0145

細胞におけるTALENのオフターゲット切断
選択によって報告されたオフターゲット切断活性が、細胞でのオフターゲット切断に関連しているかどうかを試験するために、我々はin vitroでの選択結果を用いて、機械学習アルゴリズムを、ヒトゲノムで潜在的なTALENオフターゲット部位を生成するように訓練した26。このコンピューターのステップが必要であるのは、選択前ライブラリーは6個以下の変異を有する全ての配列をカバーするが、一方CCR5配列およびATM配列については、ヒトゲノムのほぼすべての潜在的なオフターゲット部位が、標的配列に対して6より多くの位置で異なるからである。このアルゴリズムは、切断が観察されなかった標的ライブラリーからの配列に対する、TALENにより切断された配列で生じる、標的の各位置の各ヌクレオチドの事後確率を算出する27。次にこれらの事後確率を用いて、アルゴリズムの訓練に使用したTALENが、10〜30bpの単量体スペーシングのヒトゲノムにおける、全ての潜在的標的配列を切断する尤度(likelihood)をスコア付けした。機械学習アルゴリズムを使用して、我々は、7〜14の位置においてオンターゲット配列と異なる、36のCCR5Aおよび36のATM TALENオフターゲット部位を同定した(表6)。

0146

CCR5AおよびATMTALENについての72のベストスコアのゲノムオフターゲット部位を、CCR5AまたはATMいずれかのTALENを発現するヒトU2OS-EGFP細胞12から精製したゲノムDNAから増幅した3。潜在的なゲノムオフターゲット部位のDNAスペーサー内に3または4以上の塩基対の挿入または欠失を含む配列であって、未処置の対照試料と比べてTALEN処置試料中に有意に高い数値で存在するものは、TALEN誘導性の修飾と考えられた。我々が首尾良く増幅した35のCCR5Aオフターゲット部位から、TALEN誘導性の修飾を有する6つのオフターゲット部位を同定した;同様に、我々が首尾良く増幅した31のATMオフターゲット部位から、TALEN誘導性の修飾を有する7つのオフターゲット部位を観測した(図3および表7)。修飾されたオンターゲットおよびオフターゲット部位の検査により、3から数十に及ぶ塩基対の範囲の欠失の保有率が得られ(図3)、これは、TALEN誘導性のゲノム修飾の、以前に説明された特徴と整合していた28。

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

該当するデータがありません

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

該当するデータがありません

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ